Documentation Index
Fetch the complete documentation index at: https://docs.anymorph.ai/llms.txt
Use this file to discover all available pages before exploring further.
AI 엔진이 브랜드를 찾고 인용하는 방식
사용자가 AI 어시스턴트에 질문하면, 응답은 단일 검색에서 나오지 않습니다. 엔진은 하나의 질문을 수십 개의 검색으로 변환하고, 수백 개의 후보 페이지를 수집한 뒤, 그중 97–98%를 버리고 나서야 인용이 포함된 답변을 생성합니다. 이 파이프라인을 이해하는 것이 GEO의 핵심입니다. 각 단계마다 다른 필터링 기준이 적용되며, 콘텐츠가 모든 단계를 통과해야 인용됩니다.1단계: 쿼리 팬아웃 (Query Fan-Out)
엔진은 사용자의 질문을 그대로 검색하지 않습니다. 하나의 질문을 8–12개의 병렬 서브쿼리로 분해하며, 각각 다른 각도를 타겟합니다: 정의, 비교, 가격, 최신 동향, 전문가 의견, 대안 등. 예를 들어 “소규모 팀에 가장 좋은 CRM은?”이라는 질문은 다음과 같이 변환될 수 있습니다:- “best CRM software small business 2026”
- “CRM comparison small teams pricing”
- “CRM features for teams under 50”
- “HubSpot vs Salesforce small business”
- 그 외 여러 변형
Google AI Mode는 복잡한 “Deep Search” 요청에 대해 수백 개의 서브쿼리를 실행하며, 이를 위해 특별히 설계된 커스텀 Gemini 모델을 사용합니다 (Google, 2025년 5월).
2단계: 웹 검색 (Retrieval)
각 서브쿼리는 엔진의 내부 검색 백엔드에 전송됩니다:| 엔진 | 검색 백엔드 |
|---|---|
| ChatGPT | OpenAI 자체 검색 인덱스 (2024–2025년 Bing에서 전환, 현재 주요 소스) |
| Perplexity | 자체 인덱스 (2023년부터 자체 구축) |
| Google AI Overview | Google Search 인덱스 + Knowledge Graph |
| Gemini | Google Search 인덱스 |
| Claude | 비공개 (Anthropic이 검색 제공자를 공식 확인하지 않음) |
3단계: 시맨틱 랭킹 및 필터링
엔진이 수집된 모든 문서에 대해 다층 머신러닝 랭킹을 실행합니다:- 시맨틱 유사도 스코어링: 문서를 원래 쿼리와 임베딩 모델로 비교합니다. 코사인 유사도 0.88 이상인 페이지는 인용 확률이 7.3배 높습니다 (Wellows, 2025년 12월).
- E-E-A-T 게이트: 이진 통과/탈락 필터입니다. 최종 인용되는 콘텐츠의 96%가 이 게이트를 통과합니다. 기준 미달 콘텐츠는 관련성과 무관하게 탈락합니다. 저자 자격, 스키마 마크업, 도메인 신뢰도가 여기서 작용합니다.
- LLM 리랭킹: 별도 모델이 생존한 문서를 페이지 수준이 아닌 패시지(구절) 수준에서 재순위화합니다.
4단계: 패시지 추출
AI 엔진은 전체 페이지를 읽지 않습니다. 134–167단어의 특정 구절을 추출합니다. 어떤 구절이 선택되는지를 결정하는 요소:- 정보 밀도: 사실 중심으로 밀도 높은 내용, 서론이나 장식 없음
- 자기 완결성: 주변 맥락 없이도 서브쿼리에 답변 가능
- 구조적 시그널: 제목, FAQ 블록, 비교표, 정의 박스가 파서에게 청크 경계를 알림
- 페이지 내 위치: 전체 인용의 44.2%가 페이지 상위 30% 콘텐츠에서 발생합니다. 하위 10% 콘텐츠의 인용 비중은 2.4–4.4%에 불과합니다 (AirOps, 2026)
5단계: 프롬프트 조립 (사전 인용 임베딩)
가장 많이 오해되는 단계입니다. 인용은 응답이 작성된 후에 추가되는 것이 아닙니다. LLM이 첫 토큰을 생성하기 전에 프롬프트에 구조적으로 임베딩됩니다. 오케스트레이션 엔진이 조립하는 것:- 특정 소스 URL에 연결된 인용 마커
- 생존한 문서의 순위별 패시지 발췌
- 발행일 및 권위 메타데이터
- 상충하는 소스 간 모순 해결
6단계: 응답 생성
최종 LLM이 조립된 증거에 제약받으며 응답을 생성합니다. 각 인라인 인용 번호는 4단계의 특정 패시지 발췌에 대응합니다. 결과: 처음 수집된 모든 후보 중 최종 인용되는 것은 5–15개뿐입니다. 대다수의 검색된 콘텐츠가 탈락합니다.GEO에 이것이 의미하는 것
파이프라인의 각 단계는 콘텐츠에 다른 품질을 요구합니다:| 단계 | 콘텐츠에 필요한 것 | GEO 레버 |
|---|---|---|
| 팬아웃 | 넓은 주제 커버리지 | 페이지당 여러 쿼리 각도를 다룸 |
| 검색 | 검색 엔진에서의 발견 가능성 | 기술적 SEO, 스키마 마크업 |
| 시맨틱 랭킹 | 쿼리에 대한 높은 관련성 | 인텐트 정렬 제목, 직접적 답변 |
| E-E-A-T 게이트 | 신뢰 시그널 | 저자 자격, 검증 가능한 데이터, 구조화 데이터 |
| 패시지 추출 | 자기완결적, 정보 밀도 높은 구절 | Answer Capsule, BLUF 패턴, FAQ 블록 |
| 프롬프트 조립 | 최신, 권위 있는, 모순 없는 콘텐츠 | Temporal Grounding, 엔터티 일관성 |
AI 인용을 결정하는 요인
129,000개 이상의 도메인과 6억 8천만 이상의 인용을 분석한 연구에서 6가지 핵심 요인이 밝혀졌습니다:1. 참조 도메인 권위
1. 참조 도메인 권위
AI 인용의 가장 강력한 예측 변수입니다. 신뢰도 높은 백링크 프로필을 가진 브랜드가 훨씬 자주 인용됩니다. 기존 SEO와 겹치지만 GEO에서는 더 큰 비중을 차지합니다.
2. E-E-A-T 시그널
2. E-E-A-T 시그널
경험, 전문성, 권위성, 신뢰성. AI 시스템은 실제 경험과 검증 가능한 전문가 자격을 보여주는 콘텐츠를 우선시합니다.
3. 콘텐츠 신선도
3. 콘텐츠 신선도
인용되는 페이지는 최신 콘텐츠에 편중됩니다. “최종 수정: 2026-04-07” 같은 명시적 날짜와 최신 통계가 AI 엔진에 신선도를 알립니다.
4. 엔터티 일관성
4. 엔터티 일관성
웹사이트, 소셜 프로필, 디렉토리, 서드파티 소스에서 브랜드명, 포지셔닝, 정보가 일관되면 AI 검색의 모호성이 줄어듭니다.
5. 서드파티 멘션
5. 서드파티 멘션
Reddit, G2, Trustpilot, 업계 간행물의 독립적 멘션이 AI 인용 소스에서 불균형적으로 높은 비중을 차지합니다. 링크 없는 브랜드 멘션도 기여합니다.
6. 구조화 데이터
6. 구조화 데이터
Organization, Product, FAQ, Review 스키마 마크업은 AI 엔진이 검색 시 브랜드 정보를 추출하고 검증하는 데 도움을 줍니다.
실제로 개선할 수 있는 것
6가지 요인 중 일부는 직접 통제 가능하고, 일부는 장기 투자가 필요합니다:| 요인 | 통제 수준 | 개선 방법 |
|---|---|---|
| 도메인 권위 | 간접적 (장기) | 양질의 콘텐츠 발행, 자연 백링크 확보, SEO Health에서 기술적 이슈 수정 |
| E-E-A-T 시그널 | 높음 | 저자 자격, 사례 연구, 검증 가능한 데이터를 페이지에 추가 |
| 콘텐츠 신선도 | 높음 | 날짜 포함 페이지 유지, 분기별 통계 갱신 |
| 엔터티 일관성 | 높음 | 브랜드 설정으로 웹사이트, 프로필, 디렉토리 전반의 브랜드 정보 정렬 |
| 외부 채널 멘션 | 낮음 (리스크 있음) | 자연스러운 커뮤니티 참여; 유료/자동화 접근은 상당한 리스크 수반 |
| 구조화 데이터 | 높음 | 스키마 마크업, FAQ 블록, 논리적 제목 계층 구조 추가 |
엔진별 특성
각 AI 엔진은 서로 다른 소스 선호도를 가집니다:| 엔진 | 주요 소스 | 전략 |
|---|---|---|
| ChatGPT | OpenAI 자체 검색 인덱스, Wikipedia 비중 높음 | 구조화된 콘텐츠 + Wikipedia 프레젠스 |
| Perplexity | 자체 인덱스, Reddit 비중 높음, 실시간 검색 | 커뮤니티 참여 + 최신 콘텐츠 |
| Google AI Overview | Google 오가닉 결과 (기존 검색 순위와 높은 상관관계) | 기존 SEO + Schema 마크업 |
| Claude | 비공개, E-E-A-T 시그널 | 팩트 기반, 권위 있는 콘텐츠 |
| Gemini | Google Search 인덱스 | Google SEO + 구조화 데이터 |
Anymorph의 가시성 측정 방식
PAWC (Position-Adjusted Word Count)
Anymorph는 프린스턴 KDD 2024 연구 논문과 동일한 지표인 PAWC를 핵심 가시성 측정 방식으로 사용합니다:GEO Score (0–100)
전체 AI 가시성은 6개 서브스코어의 가중 합산인 GEO Score로 표현됩니다:| 서브스코어 | 가중치 | 측정 내용 |
|---|---|---|
| Visibility | 30% | PAWC 기반 가시성 지수 |
| SOV Rank | 20% | 경쟁사 대비 Share of Voice 순위 |
| Sentiment | 15% | 긍정 vs 부정 브랜드 멘션 |
| Citation Coverage | 15% | 자사 도메인으로 향하는 인용 비율 |
| Consistency | 10% | AI 엔진 간 균일성 |
| Intent Coverage | 10% | 검색 의도별 가시성 분포 |
등급 체계
| 등급 | 점수 | 의미 |
|---|---|---|
| A | 80+ | 강력한 AI 포지션. 유지 및 확장. |
| B | 60–79 | 좋은 가시성. 1-2개 영역 최적화 필요. |
| C | 40–59 | 평균. 체계적 GEO 전략 필요. |
| D | 20–39 | 낮은 가시성. 기본 콘텐츠 구축 시급. |
| F | < 20 | AI에 거의 보이지 않음. 전면 재검토 필요. |
Share of Voice
Anymorph는 SOV를 두 가지 방식으로 계산합니다:- PAWC 기반 SOV: 학술적으로 정밀하며, 멘션 위치와 길이를 고려
- 멘션 수 기반 SOV: 직관적인 브랜드 멘션 수 대 경쟁사 비교
벤치마크
SOV 벤치마크
- < 5%: AI 응답에 거의 없음
- 5–15%: 존재하나 권위 부족
- 15–30%: 경쟁력 있는 프레젠스
- 30%+: AI 응답의 카테고리 리더
Citation Drift
월간 인용 변동 약 55%는 정상입니다. AI 엔진은 비결정적이므로 일정 수준의 변동은 예상됩니다. 일별 변화보다 30일 이상의 추세가 더 의미 있습니다.다음 단계
GEO 전략
AI 인용을 높이는 9가지 핵심 속성을 알아봅니다.
가시성 대시보드
GEO Score와 지표를 실제로 확인합니다.