BrandVis 활용을 위한 사전 지식
LLM 그리고 AI 검색에 대하여
LLM(Large Language Model:거대 언어 모델)
LLM은 “사람의 언어를 이해하고 대화(소통)할 수 있는 인공지능”을 의미 합니다.
대부분 웹을 통해 뉴스,책,웹사이트,대화문 등을 학습하고 “언어의 패턴과 의미/맥락”을 익힌 똑똑한 대화형 두뇌라고 할 수 있습니다.

사람이 책을 많이 읽으면 말이 드는 것처럼, LLM도 수많은 글을 읽고 ‘사람들이 어떻게 말하고 생각하는지’를 배웁니다.
기억하는 게 아니라, ‘패턴을 익히는 것’이 LLM의 핵심 입니다. 예를 들어, “비가 오면…”이라는 말을 들으면 “우산을 써야지”라는 문장이 자주 이어진다는 걸 학습 합니다. 그래서 사람처럼 ‘생각’하거나 ‘기억’하지는 않지만, 언어의 흐름을 예측해서 말처럼 만들어내는 기술로도 이해할 수 있습니다.
예)
질문: “오늘 날씨가 흐리면 세탁해도 될까?” 에 대해
LLM의 답: “흐린 날에는 습도가 높아서 빨래가 잘 안 마를 수 있어요. 가능하면 건조기를 사용하세요.” 와 같은 대답은 LLM 인터넷이나 책의 내용을 그대로 외운 게 아니라, “흐리다 → 습하다 → 빨래가 잘 안 마른다”라는 ‘언어적 상식 패턴을 학습’한 결과 입니다.
구분
내용
이름
Large Language Model (대형 언어 모델)
뜻
사람이 쓰는 언어를 이해하고 생성하는 인공지능
학습 방식
수많은 문장 속 ‘언어 패턴’을 통계적으로 학습
비유
책을 많이 읽은 똑똑한 언어 예측기
특징
기억보다는 ‘예측’을 잘하는 두뇌
활용
대화, 글쓰기, 요약, 번역, 상담 등
LLM 특징
생성 능력: 인간과 유사한 자연스러운 언어를 생성하고, 소설, 코드, 번역 등 다양한 형태의 콘텐츠를 창의적으로 만들어낼 수 있습니다.
문맥 이해: 긴 대화의 흐름이나 복잡한 질문의 문맥을 이해하고 일관성 있는 답변을 제공할 수 있습니다.
추론 및 요약: 학습된 지식을 바탕으로 추론하고, 방대한 텍스트를 요약하거나 특정 질문에 대한 직접적인 답변을 생성할 수 있습니다.
참고 할만한 자료
논문명
요약 및 주요 내용
A Survey of Large Language Models (2023) (arXiv)
LLM의 배경, 주요 기술 진화, 응용 분야 등을 정리. 학술·산업 양측의 발전 흐름을 소개.
Large Language Models: A Survey (2024) (arXiv)
최근 LLM 가족들(예: GPT, LLaMA, PaLM)을 중심으로, 데이터셋, 평가 지표, 한계점까지 폭넓게 탐색.
A Survey on Evaluation of Large Language Models (ACM Digital Library)
“어떻게 평가할 것인가”라는 관점에서 LLM 평가메트릭, 평가환경, 과제 등을 집중적으로 다룸.
"Attention Is All You Need" (2017): Google
기존의 순환 신경망(RNN)이나 컨볼루션 신경망(CNN) 없이 어텐션(Attention) 메커니즘만을 사용하여 인코더-디코더 구조를 제안했습니다. 이것이 트랜스포머 구조의 시작이며, 현재 모든 LLM의 근간이 되는 혁신적인 논문.
Language Models are Unsupervised Multitask Learners" (GPT-2, 2019): OpenAI
대규모 데이터로 사전 훈련된 모델이 별도의 미세 조정 없이도 다양한 작업(번역, 요약 등)을 수행할 수 있는 능력을 보여주어, Zero-Shot Learning의 가능성을 입증.
"Scaling Laws for Neural Language Models" (2020): OpenAI
모델 크기, 데이터셋 크기, 컴퓨팅 자원을 늘렸을 때 언어 모델의 성능이 어떻게 향상되는지 수학적으로 분석한 논문입니다. LLM의 성능 향상이 스케일링(Scaling)에 비례한다는 경험적 법칙을 제시
주요 LLM 모델(AI 플랫폼)과 특징
모델명
개발사
주요 특징
Perplexity
Perplexity AI, Inc.
실시간 웹 검색 & AI 응답 결합: Perplexity는 단순한 링크 나열 검색이 아니라, 사용자 질의에 대해 웹에서 정보를 찾아내고, 이를 AI 언어모델이 자연어 형식으로 정리·제공.
LLaMA (또는 Llama) 시리즈
Meta AI (Medium)
오픈소스 지향, 다양한 크기(7B, 13B, 30B, 65B 등) 모델 제공. 비용 효율성과 유연성이 특징. (KLU)
Claude 시리즈
Anthropic (codingscape.com)
안전성(safety), 신뢰성(reliability)에 강점 둔 모델로 평가됨. 기업용·복잡한 태스크에 적합하다는 평가.
참고 팀 그리고 비교 포인트
파라미터 수(Parameter count): 모델의 규모를 판단하는 참고 지표 입니다.
컨텍스트 윈도우(Context Window): 한 번에 처리할 수 있는 입력 길이를 의미 합니다. 워크플랫폼 내부에서 긴 문서 분석이 필요하다면 이 포인트 중요 합니다.
멀티모달(Multimodal): 텍스트뿐 아니라 이미지·음성·비디오 등 다양한 입력소스를 지원 지원하는 서비스/기능을 의미 합니다.
LLM 기반 AI 플랫폼의 작동 방식
LM이 사용자의 질문에 답변을 생성하기까지의 내부 동작 과정은 크게 4단계로 요약할 수 있습니다.
이 과정에서 RAG(Retrieval Augmented Generation)이라는 방식을 활용 합니다.
단계
핵심 동작
설명
1단계
프롬프트 분석(Prompt Analysis)
사용자 질의 토큰화
임베딩 생성
질의 의도 파악
입력된 질문 텍스트를 LLM과 검색 시스템이 이해할 수 있는 수치적 벡터(임베딩)로 변환.
이 임베딩은 단순한 키워드 매칭을 넘어 질문의 의미적 의도를 포착하는 데 사용.
2단계: 검색
벡터 변환 및
지식 검색(Retrieval)
LLM이 모델이 이해할 수 있도록 의미와 문맥을 담은 고차원 벡터로 변환.
외부 지식기반에서 가장 관련성이 높은 조작(Context Chunks) 검색.
3단계: 답변 준비
콘텐츠 평가(Content Evaluation),
문맥 파악 및 표현 정교화
검색된 문서들이 질문에 충분히 관련성,신뢰성이 있는지 평가.
답변을 구성하기에 충분하고 신뢰할 수 있는 정보인지 내부적으로 필터링(중복제거,최적화)하고 선별.
4단계: 출력
답변 생성 및 응답
(Generation)
선별된 외부 콘텐츠를 원래 질문과 결합하여 증강된 프롬프트를 구성한 뒤, LLM 코어 모델이 이에 기반하여 최종 답변을 생성
기존 검색엔진과 차이점
구분
LLM
기존 검색엔진
초점
결과(답변) 도출
과정(정보원) 검색
방식
대화형 답변 생성
키워드 기반 정보 목록 제시
제공형태
질문에 대한 종합적인 서술/대화형 응답
질문에 관련된 웹페이지 링크 목록
정보의 근거
주로 학습된 내부 데이터 및 최신 정보를 위한 외부 검색 연동
웹상의 실시간/최신 문서 및 웹사이트
단점/주의할 점
학습 데이터에 기반해 환각(Hallucination) 현상(잘못된 정보를 사실처럼 생성) 발생 가능성
사용자가 직접 링크를 클릭하여 정보의 진위 여부를 판단하고 종합해야 함
AI 플랫폼에서 왜 프롬프트가 중요한가?
프롬프트의 질(Quality)이 AI가 생성하는 결과물의 질을 결정하기 때문입니다.
결과의 정확성 결정: 명확한 프롬프트는 AI의 오해를 줄이고 사용자가 원하는 정보에 정확히 초점을 맞추게 합니다.
시간 절약 및 효율성: 잘 만들어진 프롬프트는 AI가 불필요한 내용을 생성하지 않게 하여, 여러 번 수정하거나 다시 질문할 필요 없이 한 번에 원하는 결과를 얻게 합니다.
잠재력 극대화: AI의 역할, 대상, 형식 등을 구체적으로 지정하여 AI의 능력을 최대한 활용하고 평범한 답변을 전문적인 결과물로 바꿀 수 있습니다.
효과적인 프롬프트 제작
좋은 프롬프트는 보통 다음 4가지 핵심 요소를 포함합니다. 역할(Persona), 임무(Task), 맥락(Context), 형식(Format)
단계
요소
설명
예시 적용
1단계
역할 부여
AI가 어떤 ‘전문가(페르소나)’처럼 행동해야 하는지 지정합니다. (답변의 톤앤매너, 전문성을 결정)
"당신은 최고의 스타트업 마케팅 컨설턴트입니다."
2단계
명확한 임무 및 맥락
AI가 무엇을 해야 하는지와 임무 수행에 필요한 ‘배경 정보(조건)’를 구체적으로 제공합니다.
"한국의 20대 1인 가구를 위한 새로운 배달 앱 런칭 전략을 수립해야 합니다. 경쟁사 분석 후 3가지 차별화된 핵심 전략을 도출하세요."
3단계
원하는 형식 지정
결과물의 길이, 형식, 스타일 등을 지정하여 제어합니다.
"결과는 표 형태로 작성하고, 각 전략별 예상 ROI와 실행 방안을 포함해야 합니다. 문체는 간결하고 전문적이어야 합니다."
나쁜 프롬프트와 좋은 프롬프트
구분
프롬프트 내용
AI 응답의 예상 결과
나쁜 프롬프트
"마케팅 전략 좀 알려줘."
너무 일반적이고 광범위한 마케팅 개념만 나열하여 실용성이 떨어짐.
좋은 프롬프트
"당신은 숙련된 B2B SaaS 영업 전문가입니다. 제가 최근 출시한 업무 자동화 솔루션에 대한 첫 콜 스크립트를 작성해 주세요. 잠재 고객의 흔한 반대 의견 3가지에 대한 대응 방안도 포함하여 불릿 포인트 형식으로 정리해 주세요."
‘전문적인 역할(영업 전문가)을 부여’하고, ‘구체적인 임무(B2B SaaS 첫 콜 스크립트)’와 필수 내용(반대 의견 대응), ‘형식(불릿 포인트)’까지 지정했기 때문에 즉시 사용 가능한 실용적인 결과를 얻을 수 있습니다.
BrandVis가 프롬프트를 제작하는 과정 : 페르소나틱스(Personatics)
고객 브랜드 정보 수집
고객 도메인,온드 미디어 콘텐츠를 분석하고 고객(브랜드)을 이해 합니다.
제3의 웹사이트(도메인)으로부터 실제 사용자들의 경험과 평가를 수집해서 페르소나 정의에 필요한 조건을 정의 합니다.
페르소나(Persona) 정의
내부 모델을 통해 이해한 고객정보와 수집한 정보를 바탕으로 최적의 페르소나를 정의 합니다.
평가모델을 통해 만들어진 페르소나의 적합성을 평가하고 타깃 고객군과 동일한 수준의 페르소나를 완성해 갑니다다.
여정에 따라 프롬프트 생성
브랜드 또는 상품 소비 경험을 바탕으로 고객 여정을 정의하고 페르소나와 결합한 프롬프트를 생성 합니다.
내부 모델을 통해 프롬프트의 적설정,기대 답변 수준 등을 평가하고 실제 AI 플랫폼에서의 답변을 통해 유효한 프롬프트만을 선별해 냅니다.
동일한 프롬프트에 대해 AI 플랫폼이 다르게 반응하는 이유
AI 플랫폼은 동일한 프롬프트(질의)에 대해 다르게 응답할 수 있습니다. 즉 ChatGPT에서는 내 브랜드를 언급하고 추천하지만 Gemini에서는 언급하지 않거나 추천하지 않을수 있습니다. 또 어떤 플랫폼에서는 가시성이 좋지만 다른 플랫폼에서는 가시성이 나쁠 수 있습니다.

AI가 다른 답변을 내놓는 세 가지 이유
AI 모델은 단순한 데이터베이스가 아니라, 다음에 올 단어를 '확률적으로 예측'하여 문장을 창작하는 '확률 기계'에 가깝기 때문입니다.
1. 창의성의 조절 장치: 온도 (Temperature)
AI 모델에는 답변의 '창의성' 또는 '무작위성'을 조절하는 온도(Temperature)라는 설정값이 있습니다.
원리: AI는 다음에 올 수많은 단어 중 가장 가능성이 높은 단어 목록을 가지고 있습니다. 온도가 높을수록 가장 가능성이 높은 단어 대신 덜 일반적이고 창의적인 단어를 선택할 확률이 높아집니다.
예시: 당신이 "사과에 대한 짧은 시를 써줘"라고 물었을 때,
온도 0.1 (낮음): 매번 비슷한 톤과 단어("빨간", "과일", "나무")를 사용한 예측 가능한 시를 생성합니다.
온도 0.8 (높음): 매번 완전히 다른 단어("아침", "철학", "중력")를 섞어 사용한 새롭고 독특한 시를 생성합니다.
2. 학습 데이터와 알고리즘의 차이 (뇌 구조의 차이)
ChatGPT, Gemini, Claude 등 각 AI 플랫폼은 서로 다른 데이터셋으로 학습했으며, 모델 구조와 알고리즘도 다릅니다. 이는 사람마다 자라온 환경과 성격이 다른 것과 같습니다.
원리: 모델마다 '가치관'과 '정보 우선순위'가 다릅니다.
플랫폼
선호 도메인 / 웹사이트
콘텐츠 유형
왜 선호하는가(이유)
평가·인용 통계
ChatGPT
Wikipedia (en.wikipedia.org) / Reddit (reddit.com) / Forbes (forbes.com) / Business Insider (businessinsider.com) (Ahrefs)
사실 기반 Q&A,
설명형 콘텐츠,
비교·리뷰 콘텐츠
권위 있는 백과사전적 정보(Wikipedia)와 활발한 커뮤니티 의견(Reddit)을 조합해서 “안정적이면서 폭넓은 정보”를 제공하기 유리함. 게시물이나 리뷰 같은 UGC(User-Generated Content)도 인용됨. (BuzzStream)
Wikipedia가 ChatGPT 인용 도메인의 약 47.9%를 차지했다는 분석 있음. (Profound)
Gemini
YouTube (youtube.com) / Blog.Google (blog.google.com) / Reddit (reddit.com) / Quora (quora.com) (Ahrefs)
멀티미디어 병합형 콘텐츠(텍스트+영상), 기술 분석, 문제-해결형 콘텐츠
Google 생태계의 강점인 영상·텍스트 통합(multimodal) 처리 및 기술문서·자체 블로그 활용 가능성이 높기 때문. 또한 사용자 ‘영상 검색’이나 ‘튜토리얼’ 수요와 맞음.
Google AI Mode(=Gemini 기반)의 최다 인용 도메인은 Wikipedia, YouTube, blog.google 등. (Ahrefs)
Claude
Capterra / PCMag / Gartner (industry reports) / Reddit (reddit.com) (higoodie.com)
긴 리포트·분석형 콘텐츠, 전문 업무용 문서, 신뢰성 높은 자문형 콘텐츠
Anthropic이 “신뢰성(honesty) + 전문성”을 강조한 모델 설계 방향을 가지고 있어, 따라서 산업 리포트나 전문 리뷰, 신뢰 있는 출처 중심 콘텐츠가 유리함.
B2B SaaS 도메인 인용 조사에서 Claude는 Capterra 등 리스트형/검토형 사이트의 인용이 두드러짐. (higoodie.com)
Perplexity
Reddit (reddit.com) / YouTube (youtube.com) / LinkedIn (linkedin.com) / Wikipedia (wikipedia.org) (Profound)
질문-응답형 검색 콘텐츠, 최신 이슈 분석, 커뮤니티 기반 콘텐츠
Perplexity는 검색+생성(AI Answer Engine) 구조로 설계돼 있어서, 실시간 웹 정보, 토론·커뮤니티 기반 신선한 정보, 출처 명시 등이 중요함. 따라서 커뮤니티·UGC 영향력이 큰 도메인을 인용하는 경향 있음. (Profound)
인용 분석에서 Perplexity의 인용 상위 도메인 중 Reddit이 약 46.7%를 차지했다는 데이터 존재. (Profound)
예시: "자율주행차의 미래에 대해 논하시오."라는 프롬프트에 대해,
A 모델: 기술 발전의 윤리적 문제와 사회적 영향에 중점을 둔 답변을 내놓습니다.
B 모델: 최신 센서 기술이나 소프트웨어 업데이트 등 공학적이고 기술적인 내용에 치중한 답변을 내놓습니다.
3. 맥락의 누적과 시스템 지침 (대화의 기억)
같은 질문이라도, AI는 '새 채팅'에서 물었는지, 아니면 '이전 대화가 길게 진행된 채팅'에서 물었는지에 따라 다르게 답합니다.
원리: AI는 현재 대화창에서 이전 모든 내용을 맥락(Context)으로 기억하고 답변에 반영합니다. 심지어 사용자에게는 보이지 않는 **'시스템 지침(System Prompt)'**도 영향을 줍니다.
예시:
새 채팅: "파리 여행 계획을 짜줘." $\rightarrow$ 일반적인 관광지 목록이 나옵니다.
이전 대화가 누적된 채팅: (직전에 "저는 역사학자이고 50대이며 미술에 관심이 많다"는 대화를 나눴다면) 같은 질문("파리 여행 계획을 짜줘.") $\rightarrow$ 루브르 박물관의 특별 전시회, 19세기 건축 투어 등 개인화된 답변이 나옵니다
용어 해설
우리가 사용하는 AI 플랫폼에 대한 설명
프롬프트(Prompt) : 사용자가 AI플랫폼 화면에 입력하는 질문, 지시, 요청을 의미합니다. LLM의 답변 품질을 결정하는 가장 중요한 입력 소스 입니다. Task (수행해야 할 작업)라고도 불립니다.
응답/답변(Response/Answer) : LLM 모델이 프롬프트에 대해 생성하여 사용자에게 제시하는 출력 결과(텍스트,이미지,동영상 등) 입니다.
AI 플랫폼 중요 개념
다중 모드 (Multimodal): 텍스트뿐만 아니라 여러 가지 유형의 데이터(이미지, 오디오, 비디오 등)를 동시에 처리하고 이해할 수 있는 AI의 능력을 의미 합니다.
딥리서치 (Deep Research): (특정 기능 명칭) 수십 개의 사이트를 검색하여 매우 상세하고 심층적인 보고서를 만드는 기능을 의미 합니다.
맥락 (Context): AI가 현재 대화를 이해하는 데 필요한 이전 대화의 내용이나 배경 정보를 의미합니다. 충분한 맥락이 유지되어야 자연스러운 연속 대화가 가능하고 정확한 답변을 기대할 수 있습니다.
메모리 (Memory) : AI플랫폼이 사용자와의 대화 내용을 장기간 기억하여 다음 대화에서 이를 참조해 더욱 개인화된 응답을 제공하는 기능을 말합니다.
환각 (Hallucination): AI가 사실이 아니거나 잘못된 정보를 마치 사실인 것처럼 생성해내는 현상을 말합니다.
BrandVis에서 중요 용어
가시성(Visibility)

GEO 가시성은 내 웹사이트나 콘텐츠가 ChatGPT, Gemini, Google AI Overviews 같은 생성형 AI 모델의 답변에 얼마나 자주, 그리고 눈에 띄게 인용되는지를 나타내는 지표 입니다.
쉽게 말해, 전통적인 검색(SEO)처럼 링크 목록에서 상위에 오르는 것이 아니라, AI가 사용자에게 주는 요약 답변에 내 브랜드 정보가 "출처"로 선택(언급 또는 인용)되는 정도를 말합니다.
핵심목표 : AI가 수많은 웹페이지 중에서 내 콘텐츠를 가장 신뢰할 만하고, 정확하며, 질문과 맥락이 맞는 핵심 정보로 인식하고 활용하도록 만드는 것입니다.
구분
SEO 가시성
GEO 가시성
목표
검색 결과 페이지(SERP)에서 상위 순위에 링크가 노출되는 것.
AI 생성 답변에서 출처로 인용되거나 핵심 정보로 활용되는 것.
측정 기준
검색 노출량, 클릭률(CTR), 순위 등.
AI 답변 내 인용 빈도, 브랜드 언급 횟수, 핵심 요약에 포함되는 정도.
계산 방법
AI 답변에서 언급량, 감정 지수,인용 횟수 등 주요 지표에 가중치를 반영하여 계산
프롬프트 수와 응답한 AI 플랫폼의 수 또한 가시성 계산에 영향을 줍니다.
평균 값으로써 가시성이 높다고 해도 개별 AI 플랫폼에서 가시성은 낮을 수 있습니다.
언급(Mention)

언급(Mention)
AI 플랫폼의 답변 안에서 내 브랜드가 포함된 답변의 수를 의미합니다. 위 이미지를 기준으로 언급량은 *** 개
언급 포지션(Position) : 나를 언급한 답변과 경쟁사를 언급한 답변 수를 기준으로 한 순위를 의미 합니다.
점유율(Share of Voice) : AI의 전체 답변 중 나를 언급한 답변의 비율을 의미 합니다.

감정(Sentiment) : 나에 대해 긍정적으로 언급한 답변,부정적으로 언급한 답변,중립적으로 언급한 답변으로 나눠 구분한 감정지표를 의미 합니다.

인용(Citation)

인용 콘텐츠 :
AI 답변 안에서 인용된 모든 웹페이지(URL)
AI가 답변을 생성하는 과정에서 권위 있고 신뢰 할만 하다고 판단한 소스를 의미 합니다.
내 콘텐츠 인용
AI가 답변을 생성하는 과정에서 인용한 내 도메인/온드 미디어의 콘텐츠(웹페이지)
도메인(Domain)
AI가 참조한 콘텐츠(웹페이지)가 포함된 웹사이트 주소
나를 언급한 도메인
내 도메인,온드 미디어를 제외하고 나에 대해 언급하고 있는 제3의 웹사이트
AI 플랫폼별 성과(Performance)
가시성은 응답/답변에 참여한 AI 플랫폼 수의 평균값을 의미 합니다.
따라서 개설 AI 플랫폼에서의 가시성은 그것보다 높거나 낮을 수 있습니다. 이것이 개별 AI 플랫폼에서의 성과를 측정하는 이유 입니다.
BrandVis는 ChatGPT,Gemini,Perplexity,Claude를 대상으로 프롬프트와 답변을 수집해서 분석하고 가시성 지표를 제공 합니다.
BrandVis가 탐색하고 분석하는 AI 플랫폼
BrandVis는 ChatGPT,Gemini,Perplexity,Claude 등과 같은 주요 AI 플랫폼을 대상으로 페르소나 프롬프트와 답변 내용을 분석하여 인사이트를 제공합니다.

마지막 업데이트
