우리가 LLM의 답변은 여러 가지 방법을 통해서 전수는 아니지만 확인할 수 있습니다. 프롬프트를 대량으로 만들어서 LLM 플랫폼에 질의를 하면 어떤 식의 답변이 나오는지를 확인할 수 있습니다. 그런데 사람들은 어떤 질문을 하고 있는지를 확인하는 것은 현재는 불가능합니다. 그래서 LLM에 역으로 질문을 만들어 달라고 하거나 패널 조사 등을 통해서 확인하는 방법을 사용합니다. 그런데 구글에는 사용자의 질문을 유추할 수 있는 힌트가 있습니다. 바로 관련 질문입니다. AIO를 분석해 보면 검색 결과 페이지를 요약한 것으로 볼 수 있지만 조금 생각의 방향을 바꿔서 보면 어떤 질문이 있었고 그 질문의 답으로 만들어진 답변이라는 점을 알 수 있습니다. 조금 쉽게 이야기하면 질문과 답의 쌍으로 분석할 수 있다는 겁니다. 사용자가 어떤 질문을 하는지는 어떤 플랫폼에서도 확인이 어렵지만 다행히 구글은 LLM이 도입되기 전부터 제공하던 Feature를 통해서 이를 확인할 수 있습니다. 바로 관련 질문입니다.
관련 질문 (PAA) vs 관련 검색어 (Related Search)
- 구글의 검색 서비스에는 사용자의 검색을 쉽게 할 목적으로 제공하는 많은 기능이 있습니다. 검색어를 입력하면 검색의 목적이 되는 문서의 링크만을 제공하던 초기 검색 서비스에서 사용자의 다양한 요구사항을 처리하기 위한 목적으로 만들어진 기능들입니다. 이 기능 중에서 검색 사용자가 많이 사용하는 기능이 자동완성, 관련 검색어, 관련 질문 같은 것들입니다. 자동완성은 검색창에 키워드를 입력하는 중간에 사용자가 입력할 만한 단어를 완성해 주는 기능입니다. 그리고 관련 검색어와 관련 질문은 비슷해 보이지만 생성 방법과 목적이 많이 다른 주요 기능입니다.
- 관련 검색어는 검색 세션 기반의 행동 분석 Data를 활용한 기능입니다. 사용자가 구글에 접속해 하나의 목적을 가지고 연이어 입력하는 일련의 검색 흐름을 검색 세션이라고 하는데 특정 키워드를 입력하면 이전에 있었던 다른 여러 사람의 검색 세션을 기반으로 다음 단어를 추천해 주는 것입니다. 기본적으로 현재의 검색 페이지에서 벗어나서 다음 검색 페이지로 이동하는 형태입니다. 의미보다는 많은 검색 사용자의 검색 행동에 기반해서 구성된다고 볼 수 있고 많은 경우에 의미가 점차 구체적으로 변하는 특징을 가지고 있습니다.
- 관련 질문은 웹 문서 안의 텍스트와 그 의미를 기반으로 추출된 질문들입니다. 사용자가 검색어를 입력하면 구글 알고리즘은 그 단어와 의미상으로 밀접하게 연결된 “질문-답변” 쌍을 웹 문서 안에서 탐색합니다. 관련 질문은 관련 검색어와 다르게 현재의 검색 페이지를 벗어나게 구성되지 않습니다. 해당 페이지 안에서 사용자가 궁금해할 만한 질문을 제안하고 그 답변을 제공함으로써 그 안에서 원하는 정보를 취득할 수 있게 합니다. 이런 알고리즘을 통해서 추천 스니펫을 만들었고 여기서 더 발전되어서 AIO까지 이어지게 된 것입니다. 요즘은 관련 질문에 별도의 AIO를 제공하기도 합니다.
엔티티 키워드(대상 키워드)와 관련된 모든 질문
- 리스닝 마인드의 장점은 대략의 키워드 정보를 한꺼번에 분석할 수 있다는 점입니다. 다른 글에서도 이야기했지만 리스닝 마인드는 주요 기능으로 검색어와 동일한 토큰(단어)을 모두 조회하는 쿼리파인더, 검색 경로를 보여주는 패스파인더, 그리고 검색어를 기반으로 앞뒤의 검색 의도를 클러스터링한 클러스터 파인더가 있습니다. 검색하는 목적에 따라 다른 키워드들이 보이지만 원리는 유사하므로 여기서는 인텐트 파인더를 중심으로 설명하도록 하겠습니다.
- 쿼리파인더에 “콜라겐”을 입력하고 디스커버리 영역에서 관련 질문을 조회하면 다음과 같은 결과를 볼 수 있습니다.

- 콜라겐으로 조회된 키워드는 18.875개인데 검색량 10을 넘는 키워드는 3,899개이고 그중에 관련 질문을 보유한 키워드는 2,272개입니다. 이 중에 검색량을 기준으로 상위 1,000개를 분석했습니다. 관련 질문을 보유한 모든 키워드를 분석할 수도 있지만 1,000개가 넘어가면 연산량이 많아지면서 속도가 느려지고 LLM을 활용한 결과가 좋지 않아지는 것으로 판단해서 숫자를 제한 했습니다. 1,000개의 키워드를 의미 기반으로 분류하면 7개의 클러스터, 66개의 클러스터로 분류됩니다.
- 이렇게 정리하고 보면 관련 질문에서 얻을 수 있는 몇 가지 인사이트가 있습니다.
⓵ 일반적으로 관련 질문은 검색 페이지에서 4개 정도가 제공됩니다. 물론 한번 관련 질문을 클릭하면 계속 새로운 질문을 추가로 제공해 주지만 첫 결과에서 제공된 질문은 4개입니다.
⓶ 같은 질문이 여러 검색 결과에 노출됩니다. 몇 가지 이유가 있을 텐데 특정 사안에 대해서 사람들의 질문이 유사하고 그렇다 보니 답변으로 제공하는 문서가 동일하고 그래서 관련 질문도 동일한 것이 많을 것으로 생각합니다.
⓷ 키워드당 4개의 질문이 있다면 전체 질문 개수는 4,000개 수준이어야 하는데 “콜라겐”의 경우에는 1,327개의 질문이 존재합니다.
⓸ “콜라겐”의 경우를 보면 가장 많은 질문은 “콜라겐 먹으면 안 되는 사람?” 과 “제일 좋은 콜라겐 추천?”입니다. 두 질문이 노출된 키워드의 검색량 합계가 전체 콜라겐 검색의 15%를 차지하고 있습니다. 인용된 문서는 각각 3개와 2개입니다.

관련 질문의 인용 출처 분석
- 관련 질문이 검색 결과의 콘텐츠를 질문-답변의 쌍으로부터 만들어진 것이라면 답변 문서가 어떤 것인지가 중요할 수 있습니다. 검색 사용자로서는 어떤 출처의 문서가 답변으로 나오고 있는지는 중요하지 않을 수 있습니다. 왜냐하면 구글이 신뢰도가 높은 문서를 제공해 줄 것이라는 기대가 있기 때문입니다. 하지만 마케터나 사업가 입장은 조금 다릅니다. 우리 사업에 맞는 콘텐츠 조금 더 나가서는 우리 회사의 콘텐츠가 노출되기를 희망하기 때문입니다.
- “콜라겐”의 경우에는 상위 5개의 도메인은 다음과 같습니다.

Pillyze, Doctorow, hi doc 같은 사이트가 상위를 점유하고 있다는 점은 5~6년 전의 미디어 상황과는 많은 변화가 있다는 것을 알 수 있습니다. Newtreemall은 제품을 제조하는 회사로서 상위를 점유하고 있는데 이 부분도 콜라겐과 관련된 제품을 판매하는 기업에서는 관심을 가질만한 부분이라고 생각합니다.
글을 마무리하며
구글에서 제공하는 관련 질문은 AI의 활용성이 높아지는 최근의 추세에서는 사용자와 AI의 Interaction을 알 수 있다는 점에서 우리에게 많은 인사이트를 제공한다고 생각합니다. 검색 사용자는 어떤 질문을 하고 있고 LLM은 어떤 답변을 하고 있는지를 알 수 있기 때문입니다. 그리고 이러한 질문을 특정한 로직으로 집계해서 제공하고 있는 리스닝 마인드를 활용하면 어떤 질문에 어떤 답변이 있어야 하는지를 알 수 있습니다. 위에서도 이야기했지만, 한두 개의 질문에만 답해도 LLM에 노출될 기회를 가질 수 있습니다. 이와 관련해서는 구글의 공식 문서를 참조하면 좋을 것 같습니다.
Google 검색의 생성형 AI 기능에 맞게 최적화하기 위한 Google 가이드 | Google 검색 센터 | Documentation
SEO가 잘되어 있고 사용자 질문 의도에 맞는 콘텐츠를 잘 만드는 작업은 쉽지 않고 시간이 오래 걸립니다. 하지만 작은 시작이라도 해야 어떤 것이 필요하고 어떤 것이 우리의 약점인지 알 수 있습니다. 브랜드를 AI에 노출하는 작은 시작은 구글의 검색 결과 페이지를 분석하는 것부터 해 보시기를 제안 드립니다.