본문 바로가기
자유게시판

'편견 기계': Google이 당신이 듣고 싶은 것을 알려주는 방법

by godfeeling 2024. 11. 17.

"우리는 구글의 자비에 달려 있습니다." 구글로 눈을 돌리는 미국의 미정 유권자들은 세상에 대한 극적으로 다른 견해를 볼 수 있습니다. 심지어 그들이 정확히 같은 질문을 하고 있을 때조차도 말입니다.

"카말라 해리스가 좋은 민주당 후보인가"를 입력하면 Google에서 밝은 그림을 그립니다. 검색 결과는 끊임없이 바뀌지만 지난주 첫 번째 링크는 "해리스가 민주당에 활력을 불어넣는다"는 Pew Research Center 여론 조사였습니다. 다음은 "대부분의 민주당원이 카말라 해리스가 좋은 대통령이 될 것이라고 생각한다"는 제목의 Associated Press 기사이고, 그 다음 링크는 비슷했습니다. 하지만 해리스에 대한 부정적인 이야기를 들었다면 그녀가 "나쁜" 민주당 후보인지 물어볼 수도 있습니다. 근본적으로 동일한 질문이지만 Google의 결과는 훨씬 더 비관적입니다.

"카말라 해리스가 얼마나 나쁜지 잊기 쉬웠다"고 Reason Magazine 의 기사가 맨 위에 실렸습니다. 그런 다음 US News & World Report는 해리스가 "미국에 일어날 수 있는 최악의 일"은 아니지만, 그 뒤의 결과는 모두 중요하다는 긍정적인 견해를 제시했습니다. 알자지라 의 기사는 "내가 카말라 해리스에게 투표하지 않는 이유"를 설명한 다음, 그녀가 왜 좋지 않은지에 대한 끝없는 Reddit 스레드가 이어졌습니다.

도널드 트럼프, 음모론, 논란이 많은 정치적 토론, 심지어 의학 정보에 대한 질문에서도 같은 이분법을 볼 수 있습니다. 일부 전문가들은 구글이 당신의 믿음을 그대로 앵무새처럼 따라한다고 말합니다. 그것은 당신의 편견을 악화시키고 사회적 분열을 심화시킬 수 있습니다.

미국 사우스 플로리다 대학의 정보 시스템학과 조교수인 바롤 케이한은 "우리가 찾을 수 있는 정보에 관해서는 구글에 달려 있다"고 말합니다.

바이어스 머신

Dragon Metrics 의 디지털 마케팅 디렉터인 사라 프레쉬는 "Google의 전체적 사명은 사람들에게 원하는 정보를 제공하는 것이지만, 사람들이 원한다고 생각하는 정보가 실제로 가장 유용한 정보는 아닐 수도 있습니다."라고 말합니다. Dragon Metrics는 " 검색 엔진 최적화 " 또는 SEO 라고 알려진 방법을 사용하여 회사가 웹사이트를 Google에서 더 잘 인식하도록 조정하는 데 도움을 주는 플랫폼입니다 .

Google 결과를 꼼꼼히 살펴봐야 하는 일이고, 몇 년 전 Presch는 문제를 알아챘습니다. "저는 Google이 격렬한 논쟁이 있는 주제를 어떻게 처리하는지 살펴보기 시작했습니다."라고 그녀는 말합니다. "많은 경우, 결과는 충격적이었습니다."

가장 극명한 사례 중 일부는 Google이 특정 건강 질문을 처리하는 방식을 살펴보았습니다. Google은 종종 웹에서 정보를 가져와 결과 상단에 표시하여 빠른 답변을 제공하는데, 이를 Featured Snippet 이라고 합니다 . Presch는 "커피와 고혈압의 연관성"을 검색했습니다. Featured Snippet은 Mayo Clinic의 기사를 인용하여 "카페인은 혈압을 짧지만 극적으로 상승시킬 수 있습니다."라는 단어를 강조했습니다. 하지만 그녀가 "커피와 고혈압의 연관성 없음"을 검색했을 때 Featured Snippet은 같은 Mayo Clinic 기사에서 모순되는 문구를 인용했습니다. "카페인은 혈압에 장기적인 영향을 미치지 않으며 고혈압의 위험 증가와 관련이 없습니다."

 
Google이 한 일은 사람들이 검색하는 내용을 기반으로 텍스트에서 일부를 추출하여 그들이 읽고 싶어하는 내용을 제공한 것입니다. – Sarah Presch

Presch가 "ADHD는 설탕에 의한 것인가"와 "ADHD는 설탕에 의한 것이 아닌가"를 검색했을 때도 같은 일이 일어났습니다. Google은 질문의 양쪽을 뒷받침하는 Featured Snippets을 끌어냈는데, 이는 다시 같은 기사에서 발췌한 것입니다. (실제로 설탕이 ADHD 증상에 영향을 미친다는 증거는 거의 없으며 , 확실히 이 장애를 일으키지 않습니다.)

어떤 경우에는 Google이 정확히 같은 웹 페이지에서 모순되는 정보를 가져옵니다(출처: Sarah Presch)
 

그녀는 정치적 질문에서도 같은 문제에 부딪혔습니다. "영국의 세금 제도가 공정한가"라고 물으면, Google은 보수당 의원인 나이젤 허들스턴의 말을 인용하여 실제로 공정하다고 주장합니다. "영국의 세금 제도가 불공평한가"라고 물으면, Google의 추천 스니펫은 영국의 세금이 부자에게 이롭고 불평등을 조장하는 방식을 설명합니다.

"구글이 한 일은 사람들이 검색하는 것에 따라 텍스트에서 일부를 뽑아내고 그들이 읽고 싶어하는 것을 제공한 것입니다." 프레쉬는 말한다. "그것은 하나의 거대한 편향 기계입니다."

Google은 사용자에게 편향되지 않은 결과를 제공하여 사람들이 찾고 있는 종류의 정보와 일치시킨다고 말합니다. Google 대변인은 "검색 엔진으로서 Google은 입력한 쿼리와 관련된 고품질 결과를 표면화하는 것을 목표로 합니다."라고 말합니다. "웹 전반의 다양한 관점에 대한 오픈 액세스를 제공하고, 사람들이 찾은 정보와 출처를 평가하는 데 도움이 되는 도구를 제공합니다."

필터 버블이 터지면

한 추정 에 따르면 Google은 매초 약 630만 건의 질의를 처리하며, 하루에 90억 건 이상의 검색이 이루어집니다. 인터넷 트래픽의 대부분은 Google 검색에서 시작되며, 사람들은 처음 5개 링크 이상을 클릭하는 경우가 거의 없습니다. 두 번째 페이지로 넘어가는 것은 더더욱 그렇습니다. 사용자의 눈 움직임을 추적 한 한 연구에 따르면 사람들은 종종 최상위 결과 이후의 어떤 것도 보지 않는 것으로 나타났습니다. Google 검색에서 링크를 정렬하는 시스템은 세상에 대한 우리의 경험에 엄청난 힘을 가지고 있습니다.

Google에 따르면, 회사는 이 책임을 잘 처리하고 있습니다. "독립적인 학술 연구는 Google 검색이 사람들을 필터 버블로 밀어넣고 있다는 생각을 반박했습니다."라고 대변인은 말합니다. 

인터넷상의 소위 "필터 버블"과 "에코 챔버" 문제는 뜨거운 이슈이지만, 일부 연구에서는 온라인 에코 챔버의 효과가 과장되었는지 에 대해 의문을 제기하기도 합니다 .

전문가들은 구글 검색 결과가 우리 판단의 결함을 더욱 심화시킬 수 있다고 우려하고 있습니다(출처: Serenity Strull)

하지만 검색 엔진이 확인 편향, 즉 자신의 신념을 확증하는 정보를 찾는 자연스러운 충동에 어떤 영향을 미치는지 연구한 케이한은 우리의 신념과 심지어 우리 자신의 정치적 정체성이 온라인에서 보는 것을 통제하는 시스템에 의해 흔들린다는 것은 의심의 여지가 없다고 말합니다. 그는 "우리는 정보를 받는 방식에 크게 영향을 받습니다."라고 말합니다.

Google의 대변인은 사람들이 당파적 뉴스에 노출되는 것은 Google이 처음부터 당파적 뉴스를 제공하는 것이 아니라, 사람들이 클릭하는 내용 때문이라는 결론을 내린 2023년 연구를 밝혔습니다 . 어떤 면에서는 이것이 확인 편향이 작동하는 방식입니다. 사람들은 자신의 견해를 뒷받침하는 증거를 찾고, 자신에게 이의를 제기하는 증거는 무시합니다. 하지만 그 연구에서도 연구자들은 그들의 발견이 Google의 알고리즘이 문제가 없다는 것을 의미하지는 않는다고 말했습니다. 연구자들은 "어떤 경우에는 참여자들이 Google 검색에서 매우 당파적이고 신뢰할 수 없는 뉴스에 노출되었습니다."라고 말하며, "과거 연구에 따르면 그러한 노출이 제한적일지라도 상당한 부정적 영향을 미칠 수 있습니다."라고 덧붙였습니다.

그럼에도 불구하고, 당신은 필터 버블에 갇힌 채로 있는 정보에 관여하기로 선택할 수도 있지만, "처음에 선택할 수 있는 메시지의 특정 꽃다발만 있습니다"라고 독일 베를린 공과대학교의 매개 커뮤니케이션 교수인 실비아 크노블로흐-베스터윅은 말합니다. "알고리즘은 이 문제에서 상당한 역할을 합니다."

구글은 확인 편향 문제를 해결할 전담 인력이나 팀이 있는지에 대한 BBC의 질문에 답변하지 않았습니다.

'우리는 문서를 이해하지 못합니다. 우리는 문서를 위조합니다.'

"제 생각에 이 문제는 검색 엔진의 기술적 한계에서 비롯되고, 사람들이 그 한계가 무엇인지 이해하지 못한다는 사실에서 비롯됩니다." Google 결과를 분석하는 또 다른 검색 엔진 최적화 도구인 AlsoAsked 의 설립자인 마크 윌리엄스-쿡의 말입니다 .

최근 Google에 대한 미국의 반독점 소송  에서 직원들이 검색 엔진이 사용자의 질문에 답하는 데 사용하는 몇 가지 기술을 논의하는  회사 내부 문서가 발견되었습니다. "우리는 문서를 이해하지 못합니다. 우리는 문서를 위조합니다." 한 엔지니어가 2016년 회사 프레젠테이션에서 사용한 슬라이드쇼에 이렇게 적었습니다. "사람들이 하루에 수십억 번이나 우리에게 질의와 관련된 문서를 찾아달라고 요청합니다... 기본적인 것 외에는 문서를 거의 보지 않습니다. 사람을 봅니다. 문서에 긍정적인 반응이 있으면 좋은 것이라고 생각합니다. 부정적인 반응이면 아마도 나쁜 것입니다. 엄청나게 단순화해서 말하면, 이것이 Google의 마법의 원천입니다."

"그것이 우리가 다음 사람에게 서비스를 제공하고, 유도를 계속 진행하고, 우리가 이해한다는 환상을 유지하는 방법입니다."

다시 말해, Google은 사람들이 주어진 검색어를 입력할 때 무엇을 클릭하는지 살핍니다. 사람들이 특정 유형의 정보에 만족하는 것처럼 보이면 Google이 앞으로 비슷한 질의에 대해 그런 종류의 검색 결과를 홍보할 가능성이 더 큽니다.

구글 대변인은 이러한 문서는 오래된 것이며, 쿼리와 웹 페이지를 해독하는 데 사용되는 시스템이 훨씬 더 정교해졌다고 말했습니다.

Google은 매일 수십억 건의 검색을 시스템을 통과시키기 때문에 사람들이 노출되는 정보에 대해 엄청난 영향을 미칩니다(출처: Serenity Strull)

"그 프레젠테이션은 2016년의 것이므로, 회의적으로 받아들여야 하지만, 기본 개념은 여전히 ​​사실입니다. Google은 사람들이 무엇을 좋아하는지 예측하기 위해 모델을 구축하지만, 문제는 이것이 일종의 피드백 루프를 만든다는 것입니다." Williams-Cook이 말했습니다. 확인 편향이 사람들이 자신의 신념을 강화하는 링크를 클릭하도록 만든다면, Google은 사람들에게 확인 편향으로 이어지는 링크를 보여주도록 가르칠 수 있습니다. "자녀가 좋아하는 것에 따라 식단을 선택하도록 내버려 두겠다고 말하는 것과 같습니다. 그들은 결국 정크 푸드를 먹게 될 뿐입니다." 그가 말했습니다.

윌리엄스-쿡은 또한 사람들이 "트럼프가 좋은 후보인가"와 같은 질문을 할 때 구글이 반드시 질문으로 해석하지 않을 수 있다는 것을 이해하지 못할 수도 있다고 우려합니다. 대신, 종종 "트럼프"와 "좋은 후보"와 같은 키워드와 관련된 문서만 끌어옵니다.

그는 "이런 현상은 사람들이 검색할 때 나오는 내용에 대해 잘못된 기대를 갖게 만들고, 그로 인해 사람들이 검색 결과의 의미를 잘못 해석하게 만들 수 있다"고 말했습니다.

사용자가 검색 엔진의 단점을 더 명확히 알았다면, 윌리엄스-쿡은 그들이 보는 콘텐츠에 대해 더 비판적으로 생각할 것이라고 믿는다. "Google은 검색이 실제로 어떻게 작동하는지에 대해 대중에게 알리기 위해 더 많은 노력을 기울여야 합니다. 하지만 저는 그들이 그렇게 하지 않을 것이라고 생각합니다. 그렇게 하려면 작동하지 않는 것에 대한 몇 가지 불완전함을 인정해야 하기 때문입니다."라고 그는 말한다.

Google은 검색이 결코 해결된 문제가 아니라는 사실을 공개적으로 밝히고 있으며, 회사 대변인은 이 분야에서 발생하는 심오한 기술적 과제를 해결하기 위해 끊임없이 노력하고 있다고 말했습니다. Google은 또한 사용자가 정보를 평가하는 데 도움이 되는 기능을 제공합니다. 예를 들어 " 이 결과에 관하여 " 도구와 속보와 관련된 주제에 대한 결과가 빠르게 변할 때 사용자에게 알려주는 알림이 있습니다 .

철학적 문제들

Google의 대변인은 웹 전반의 다양한 출처에서 다양한 관점을 반영하는 결과를 찾는 것이 쉽다고 말합니다. Presch가 지적한 몇 가지 예에서도 그것은 사실이라고 주장합니다. "카말라 해리스가 좋은 민주당 후보인가"와 같은 질문으로 더 아래로 스크롤하면 그녀를 비판하는 링크를 찾을 수 있습니다. "영국의 세금 제도가 공정한가"도 마찬가지입니다. 그렇지 않다고 말하는 검색 결과를 찾을 수 있습니다. "커피와 고혈압의 연관성" 쿼리의 경우 Google의 대변인은 문제가 복잡하지만 검색 엔진은 미묘한 차이를 파헤치는 권위 있는 출처를 표면화한다고 말합니다.

물론, 이는 사람들이 처음 몇 개의 결과를 지나 탐색하는 데 달려 있습니다. 결과 페이지에서 아래로 갈수록 사용자가 링크에 참여할 가능성이 줄어듭니다. 커피 관련 고혈압과 영국 세금 제도의 경우 Google은 결과를 요약하고 Featured Snippets로 눈에 띄게 자체 답변을 제공합니다. 이는 사람들이 검색 결과에서 더 아래로 내려가는 링크를 따를 가능성을 줄일 수 있습니다.

오랫동안 관찰자들은 Google이 검색 엔진에서 "답변 엔진"으로 전환하는 방식을 설명했습니다. 이 엔진에서 Google은 외부 소스를 가리키는 대신 단순히 정보를 제공합니다. 가장 분명한 예는 Google이 링크를 끌어오는 대신 AI를 사용하여 검색 쿼리에 답하는 기능인 AI Overviews를 도입한 것입니다 . 회사에서 말했듯이, 이제 " Google이 대신 검색을 하게 하세요 ".

"과거에 구글은 다른 사람이 쓴 것을 보여주었지만, 지금은 스스로 답을 쓰고 있습니다." 윌리엄스-쿡이 말했습니다. "이 모든 문제가 복합적으로 작용합니다. 이제 구글은 정답을 맞힐 기회가 단 한 번뿐입니다. 어려운 움직임이죠."

하지만 구글이 이 모든 문제를 해결할 수 있는 기술적 능력이 있다고 하더라도, 언제 어떻게 개입해야 할지 반드시 명확하지는 않습니다. 특정 신념을 뒷받침하는 정보를 원할 수 있으며, 그렇다면 구글은 이를 귀하에게 전달함으로써 가치 있는 서비스를 제공하고 있습니다.

많은 사람들이 세계에서 가장 부유하고 강력한 회사 중 하나가 진실이 무엇인지에 대한 결정을 내린다는 생각에 불편함을 느낀다고 Kayhan은 말합니다. "이것을 고치는 것이 Google의 일인가요? Google이 스스로를 고칠 수 있다고 믿을 수 있을까요? 그리고 고칠 수 있을까요? 이런 질문은 어렵고 아무도 답을 가지고 있지 않다고 생각합니다."라고 그는 말합니다. "제가 확실히 말할 수 있는 한 가지는 그들이 충분히 하지 않는다고 생각한다는 것입니다."

댓글