AI가 반복 인용하는 기업은 우연이 아니라 구조의 결과다
늘 같은 기업이 나온다
ChatGPT를 자주 쓰다 보면 이상한 점을 발견하게 된다. 같은 질문에 늘 같은 기업이 나온다는 것.
“에너지 기업의 탄소중립 전략”을 물으면 특정 몇몇 기업이 반복적으로 인용된다. “제조업의 디지털 전환”을 검색하면 또 다른 기업들이 계속 등장한다. 금융권 AI 활용, 유통업 ESG 경영, 건설업 안전 관리. 각 산업마다 늘 비슷한 이름들이 참고 자료로 제시된다.
더 흥미로운 건, 이 기업들이 반드시 해당 산업의 1-2위 대기업은 아니라는 점이다. 누구나 아는 대기업인데도 ChatGPT에 전혀 언급되지 않는 곳이 있고, 상대적으로 덜 알려진 기업이지만 계속 인용되는 곳도 있다.
비슷한 질문을 며칠 뒤에 다시 해봐도 결과는 비슷하다. 인용되는 기업은 거의 바뀌지 않는다. 마치 AI가 특정 기업들을 “신뢰할 만한 출처”로 기억하고 있는 것처럼 보인다.
차이는 뭘까? 왜 AI는 늘 같은 기업만 참고하는가?
1. 관찰되는 패턴
인용받는 기업들의 공통점
반복적으로 인용되는 기업들의 뉴스룸을 살펴보면, 몇 가지 공통된 특징이 보인다.
특징 1: 주제의 일관성
ChatGPT에 자주 인용되는 것으로 보이는 한 에너지 기업의 뉴스룸을 보면, 태그 구성이 특징적이다.
에너지 전환, 그린 에너지, 탄소중립, 순환경제, 신재생에너지, 수소 에너지, 탄소 포집, 그린 모빌리티, 저탄소 기술, 친환경 연료.
이 키워드들은 모두 하나의 큰 주제(“에너지 전환”)를 중심으로 연결되어 있는 것으로 보인다. 그리고 관련된 글들이 몇 년에 걸쳐 꾸준히 발행되고 있다.
특히 핵심 개념은 첫 등장 시점부터 명확하게 정의되어 있다:
"에너지 전환이란 단순한 신재생에너지 도입이 아니라,
에너지 생산·저장·소비 전 과정의 구조적 재설계를 의미한다."
이런 명확한 정의는 이후 발행되는 글들에서도 일관되게 유지되는 경향이 있다.
반면, 인용이 적은 것으로 보이는 다른 에너지 기업들의 경우.
뉴스룸 태그가 훨씬 분산되어 있는 경우가 많다: 신사업, ESG, 인사 소식, 사회공헌, 안전 관리, 채용, 실적 발표, 수상, 협약 체결, 캠페인.
주제가 여러 방향으로 퍼져 있다. 에너지 전환 관련 글도 있지만 전체의 일부일 뿐이고, 명확한 정의 없이 단편적으로 언급되는 경향을 보인다.
AI 입장에서 보면, 첫 번째 유형의 기업은 “이 주제에 대해 일관된 관점을 가진 출처”로, 두 번째 유형은 “여러 주제 중 하나로 언급하는 곳”으로 인식될 가능성이 높다.
특징 2: 시간에 걸친 축적
만약 한 제조 기업이 “스마트 팩토리”라는 주제로 이런 식으로 글을 발행했다고 가정해보자:
- 2021년: “스마트 팩토리란 무엇인가” (정의)
- 2021년: “스마트 팩토리가 필요한 이유” (배경)
- 2022년: “우리의 스마트 팩토리 구축 1단계” (적용)
- 2022년: “스마트 팩토리 구축 과정의 도전과제” (성찰)
- 2023년: “스마트 팩토리 1년, 데이터로 본 성과” (검증)
- 2023년: “스마트 팩토리의 다음 단계: AI 통합” (진화)
- 2024년: “스마트 팩토리와 공급망 연결” (확장)
이런 경우, 여러 글이 몇 년에 걸쳐 하나의 사고 흐름을 만든다. 최근 글은 초기 정의를 참조하고, 중간 과정의 경험을 기반으로 쓰인다.
반대로 다른 제조 기업이 이런 식이라면:
- 2024년 6월: “스마트 팩토리 구축 완료” (보도자료)
- 2024년 8월: “디지털 전환 가속화” (실적 발표)
- 2024년 11월: “AI 기술 도입” (협약 체결)
이 경우 몇 개의 글이 모두 최근 몇 개월에 집중되어 있고, 서로 연결이 약해 보인다. 각 글은 독립적인 사건 발표이고, 이전 년도의 맥락을 찾기 어렵다.
AI가 “제조업 디지털 전환 과정”을 설명할 때, 첫 번째 유형은 “여정 전체를 보여주는 출처”로, 두 번째 유형은 “최근 성과만 있는 곳”으로 인식될 가능성이 높다.
특징 3: 설명의 깊이
만약 한 금융 기업이 “AI 리스크 관리”를 이런 구조로 다뤘다면:
제목: AI 리스크 관리는 왜, 어떻게 해야 하는가
(2,000자 이상)
1. AI 리스크 관리란
- 명확한 정의
- 전통적 리스크 관리와의 차이
2. 왜 지금 필요한가
- 규제 환경 변화
- 금융 산업 특수성
3. 우리의 접근 방법
- 프레임워크 소개
- 단계별 설명
4. 실행 과정의 고려사항
- 조직 구조
- 기술 스택
- 인력 양성
5. 우리가 직면한 도전과제
- 구체적 사례
- 해결 방법 또는 진행 중인 시도
이런 구조라면 한 주제에 대해 정의부터 실행까지, 이론부터 경험까지 완결된 설명을 제공하는 셈이다.
반대로 다른 금융 기업이 이런 식이라면:
제목: AI 리스크 관리 시스템 도입
(500자 내외)
○○은행은 AI 리스크 관리 시스템을 도입했다고 밝혔다.
이번 시스템 도입으로 리스크 관리 효율이 향상될 것으로 기대된다.
○○은행 관계자는 "AI 기술을 활용해 선제적 리스크 관리 체계를 구축하겠다"고 말했다.
이 경우 결과만 발표되어 있다. 정의, 배경, 과정, 고려사항이 빠져 있다.
AI가 “금융 AI 리스크 관리”를 설명할 때, 첫 번째 유형은 “참고할 만한 설명”으로, 두 번째 유형은 “발표만 있는 곳”으로 판단될 가능성이 높다.
2. 가능한 설명
시나리오 1: 에너지 산업의 경우
ChatGPT에 “에너지 기업이 탄소중립을 어떻게 준비해야 하는지, 구체적인 단계와 고려사항을 알려줘”라고 물으면, 특정 에너지 기업의 사례가 구체적으로 인용되는 경우가 있다.
이런 기업의 뉴스룸을 살펴보면 몇 가지 공통점이 관찰될 수 있다:
주제 집중 가능성:
- “탄소중립”, “에너지 전환” 같은 핵심 주제가 상위 태그로 자주 등장
- 이 주제들이 긴밀히 연결되어 사용되는 경향
시간 흐름 가능성:
- 몇 년 전부터 관련 주제를 다룸
- 초기에는 정의와 배경 중심
- 중기에는 실행 방법론
- 최근에는 구체적 사례와 중간 점검
글의 깊이 가능성:
- 대부분 2,000자 내외 또는 그 이상
- 정의 → 배경 → 방법 → 사례 → 고려사항 같은 구조
- 이전 글을 참조하는 경우가 보임
반면 같은 산업의 다른 기업들은 이런 특징을 보일 수 있다:
- 관련 글이 상대적으로 적음
- 대부분 최근 1-2년에 집중
- 평균 길이가 짧음
- 결과 발표 위주
AI는 질문에 답할 만한 깊이가 어디에 있는지를 판단할 것이고, 그 판단은 콘텐츠 구조에서 나올 가능성이 높다.
시나리오 2: 제조 산업의 경우
흥미로운 패턴이 관찰된다. 기업 규모나 인지도가 반드시 AI 인용과 비례하지는 않는다는 것.
매출이나 브랜드 파워가 훨씬 큰 대기업인데도 ChatGPT에 인용되지 않는 경우가 있고, 상대적으로 규모가 작은 기업이 반복 인용되는 경우가 있다.
만약 자주 인용되는 중견 제조기업이 있다면, 이런 특징을 가질 수 있다:
- 뉴스룸 전체 글이 100-200개 수준
- “디지털 전환” 주제 비중이 전체의 상당 부분
- 몇 년 전부터 일관되게 다룸
반대로 인용이 적은 대기업이라면 이런 패턴일 수 있다:
- 뉴스룸 전체 글이 수백 개 이상
- “디지털 전환” 관련 글의 절대 개수는 많을 수 있음
- 하지만 전체 대비 비중은 낮음
- 최근에 집중적으로 발행
절대 글 개수는 대기업이 더 많을 수 있다. 하지만 패턴은 이렇게 다를 수 있다:
자주 인용될 가능성이 높은 유형: 관련 글들이 하나의 이야기처럼 연결
- “디지털 전환이란” → “왜 필요한가” → “어떻게 하나” → “무엇을 배웠나”
- 각 글이 이전 글을 참조하는 경향
- 시간 흐름에 따른 진화를 보여줌
인용이 적을 가능성이 높은 유형: 글들이 독립적
- 각 글이 발표문 형식
- 서로 연결이 약함
- 정의나 배경 설명이 부족
AI는 글의 개수나 기업의 규모보다는 설명의 완결성을 판단 기준으로 삼을 가능성이 높다.
시나리오 3: 금융 산업의 경우
1금융권 대형 은행들은 AI, 디지털, 혁신 관련 소식을 매우 활발하게 발행하는 경향이 있다. 그런데 ChatGPT에 “금융권 AI 활용”을 물으면 이들 은행이 언급되는 빈도가 예상보다 낮을 수 있다.
대신 상대적으로 규모가 작은 다른 금융그룹이 인용되는 경우가 관찰된다.
활발한 대형 은행이 이런 패턴이라면:
"AI 상담 챗봇 도입"
"AI 기반 여신 심사 시스템 고도화"
"AI 추천 알고리즘 강화"
"AI 보이스피싱 탐지 성과"
...
각각은 의미 있는 성과다. 하지만 AI 입장에서는:
- “AI”가 이 기업에게 무엇을 의미하는지 정의가 명확하지 않을 수 있음
- 각 시스템이 어떻게 연결되는지 설명이 부족할 수 있음
- 왜 이런 선택을 했는지 관점이 드러나지 않을 수 있음
- 과정에서 무엇을 배웠는지 성찰이 없을 수 있음
자주 인용되는 금융그룹이 이런 패턴이라면:
"금융 AI란 우리에게 무엇인가" (정의)
"AI 윤리 원칙과 실행 기준" (철학)
"AI 모델 검증 프로세스" (방법론)
"AI 도입 1년, 배운 것들" (성찰)
글 개수는 훨씬 적을 수 있다. 하지만 각 글이:
- 명확한 정의를 포함
- 서로 연결되는 구조
- 시간에 걸쳐 축적
- 관점의 일관성 유지
AI는 많은 사실의 나열보다 일관된 설명 구조를 선호할 가능성이 높다.
3. 인용 메커니즘에 대한 가설
왜 같은 기업이 계속 나올까
한 가지 가능한 설명은 이렇다. 한번 인용된 기업은 다음에도 인용될 확률이 높아진다는 것.
가능한 작동 방식:
1단계: 첫 인용
사용자: "에너지 전환이 뭐야?"
AI: [여러 출처 검토] → A기업이 명확히 정의
→ A기업 인용
2단계: 신뢰 축적
AI 내부: "A기업은 에너지 전환을 명확히 설명했다"
→ 신뢰 신호 저장 (가능성)
3단계: 다음 인용
사용자: "에너지 전환 사례 알려줘"
AI: [여러 출처 검토] → A기업이 이미 신뢰된 출처
→ 우선 검토 → 또 인용 (가능성)
4단계: 선순환
반복 인용 → 신뢰도 증가 → 다음에도 우선 검토 → 반복 인용
이것은 사람의 정보 탐색 방식과 비슷하다. 한번 좋은 설명을 들은 출처는, 다음에도 먼저 찾아보게 된다.
맥락 완결성의 가능한 효과
AI가 특정 기업을 반복 인용하는 더 근본적인 이유는 맥락 완결성 때문일 수 있다.
맥락이 불완전한 경우 예상 시나리오:
사용자: "ESG 공시 준비 방법"
AI: [출처 1] ESG 정의 찾음
[출처 2] 공시 항목 찾음
[출처 3] 준비 절차 찾음
→ 3개 출처를 조합해서 답변
맥락이 완결된 경우 예상 시나리오:
사용자: "ESG 공시 준비 방법"
AI: [출처 A] 정의, 항목, 절차 모두 있음
→ 1개 출처만으로 완결된 답변 가능
AI는 여러 출처를 조합할 수 있다. 하지만 하나의 출처에서 완결된 설명을 얻을 수 있다면, 그 출처를 선호할 가능성이 높다.
이유는 이렇게 추정할 수 있다:
- 일관성: 한 출처 = 일관된 관점
- 신뢰성: 조각 정보 조합 < 완결된 설명
- 효율성: 검증 대상 최소화
하나의 질문에 완결된 답을 제공하는 출처가 반복 인용될 가능성이 높다.
4. 확인해볼 수 있는 방법
우리 기업은 어떨까
이런 패턴이 실제로 존재하는지, 우리 기업은 어디에 해당하는지 직접 확인해볼 수 있다.
방법 1: ChatGPT에 우리 산업 질문하기
"[우리 산업]의 [핵심 도전과제/트렌드]에 대해 설명해줘"
"[우리가 다루는 주제]를 어떻게 시작해야 하는지 단계별로 알려줘"
확인할 것:
- 우리 기업이 언급되는가?
- 경쟁사는 언급되는가?
- 우리가 언급된다면, 어떤 맥락에서인가?
- 우리가 언급 안 된다면, 어떤 기업이 대신 나오나?
방법 2: 인용된 기업과 우리 비교하기
만약 ChatGPT가 다른 기업을 인용했다면, 그 기업의 뉴스룸을 방문해보자.
그 기업 살펴보기:
- 같은 주제를 몇 개 글로 다뤘나?
- 얼마나 오래 다뤄왔나?
- 글 하나의 평균 길이는?
- 정의를 명확히 제시하나?
- 글들이 서로 연결되어 있나?
우리와 비교:
- 우리는 같은 주제를 몇 개 글로?
- 우리는 언제부터?
- 우리 글의 평균 길이는?
- 우리도 정의를 제시하나?
- 우리 글도 서로 연결되나?
방법 3: 패턴 확인하기
우리 뉴스룸이 인용받을 가능성이 있는 패턴을 갖췄는지 점검:
주제 일관성
- 핵심 주제 3개 이하로 집중하고 있나
- 각 주제당 10개 이상 글이 있나
- 명확한 정의가 있나
시간 축적
- 핵심 주제를 최소 2년 이상 다뤘나
- 이전 글을 다음 글이 참조하나
- 시간에 따른 관점 진화가 보이나
설명 깊이
- 평균 글자 수 2,000자 이상인가
- 정의 → 해설 → 사례 구조를 갖췄나
- 단순 발표가 아닌 설명 중심인가
5. 관찰되는 경향
인용받는 기업들에서 보이는 공통점
반복적으로 ChatGPT에 인용되는 것으로 보이는 기업들의 뉴스룸을 살펴보면, 이런 경향들이 관찰된다.
- 핵심 주제당 글 개수: 대략 10-20개 이상
- 주제를 다룬 기간: 대부분 2년 이상
- 글당 평균 길이: 대략 2,000자 내외 또는 그 이상
- 정의 포함: 주요 글에 개념 정의가 포함되는 경향
- 글 간 연결: 이전 글을 참조하는 경우가 많음
- 시리즈 구조: 관련 글들이 연결되어 있는 경우가 많음
이것은 “정답”이 아니라 여러 사례에서 공통적으로 보이는 경향이다. 반복 인용받는 것으로 보이는 기업들이 대체로 이런 특징을 보인다는 것.
인용은 우연이 아니라 구조의 결과일 가능성
ChatGPT가 같은 기업을 반복 인용하는 이유를 정리하면:
- 주제 일관성: 같은 주제를 지속적으로, 명확하게 다루는 경향
- 시간 축적: 2-3년에 걸쳐 관점을 쌓아가는 구조
- 설명 깊이: 정의-해설-사례가 완결된 형태
이 세 가지가 갖춰지면:
- 첫 인용 가능성 ↑
- 신뢰 신호 축적 (추정)
- 반복 인용 선순환 (가능성)
반대로 이 세 가지가 부족하면, 아무리 많은 콘텐츠를 발행해도 AI는 “참고하기 어려운 곳”으로 판단할 가능성이 있다.
시작하기
만약 우리가 아직 인용받지 못하고 있다면, 지금부터 할 수 있는 것:
1단계: 주제 선택 (1개면 충분)
- 우리가 가장 잘 아는 주제
- 우리가 가장 오래 다뤄온 주제
- 우리 산업에서 가장 중요한 주제
2단계: 정의하기
- 그 주제를 우리는 어떻게 정의하는가
- 다른 사람들과 어떻게 다르게 보는가
- 왜 그렇게 정의하는가
3단계: 설명 시작하기
- 3개월마다 2-3개씩
- 각 글은 2,000자 이상
- 정의 → 해설 → 사례 구조
4단계: 연결하기
- 새 글에서 이전 글 참조
- 같은 정의 반복 사용
- 시리즈 구조 만들기
6개월 후, 최소 6개 글 1년 후, 최소 12개 글 2년 후, AI가 우리를 인용하기 시작할 가능성
인용은 하루아침에 만들어지지 않는다. 하지만 일관되게 쌓으면, 만들어질 가능성이 높다. 왜냐하면 AI는 그런 구조를 선호하도록 설계되어 있기 때문이다.