본문 바로가기
자유게시판

AI가 더 나은 정부 서비스를 위한 답일까?

by godfeeling 2024. 7. 9.

ChatGPT가 등장하기 훨씬 전부터, 정부에서는 채팅봇을 이용해 서비스와 조언을 자동화하고 싶어했습니다.

네덜란드에서 정부에 AI를 활용하는 연구를 하는 콜린 반 노르트는 "초기 챗봇은 대화 능력이 제한적이고 단순했습니다."라고 말합니다.

그러나 지난 2년 동안 생성적 AI가 등장하면서 보다 효율적인 공공 서비스에 대한 비전이 부활했습니다. 인간과 같은 자문가가 24시간 내내 일하며 혜택, 세금 및 정부가 국민과 상호 작용하는 다른 분야에 대한 질문에 답변할 수 있습니다.

생성적 AI는 인간과 유사한 응답을 제공할 만큼 정교하며, 충분한 양의 양질의 데이터로 훈련을 받으면 이론상 정부 서비스에 대한 온갖 질문을 처리할 수 있습니다.

하지만 생성 AI는 실수를 하거나 심지어는 말도 안 되는 답변, 즉 소위 환각을 하는 것으로 잘 알려져 있습니다.

정부는 AI가 신뢰할 수 있는 조언을 제공할 수 있는지 알아보고 있습니다.

영국에서는 정부 디지털 서비스(GDS)가 ChatGPT 기반 챗봇인 GOV.UK Chat에 대한 테스트를 수행했습니다. 이 챗봇은 정부 서비스와 관련된 다양한 문제에 대한 시민들의 질문에 답할 것입니다.

해당 기관은 초기 조사 결과에 대한 블로그 게시물에서 실험에 참여한 사람의 약 70%가 응답이 유용하다고 생각했다고 밝혔습니다.

그러나 일부 시스템에서는 잘못된 정보를 생성해 사실처럼 표시하는 문제가 있었습니다.

또한 블로그에서는 때때로 잘못될 수 있는 시스템에 대한 잘못된 신뢰가 있을 수 있다는 우려를 제기했습니다.

"전반적으로, 답변은 GOV.UK와 같은 사이트에서 요구되는 최고 수준의 정확도에 도달하지 못했습니다. 사실적 정확성이 중요한 사이트입니다. 우리는 정확성과 신뢰성 문제를 해결하기 위해 이 실험을 빠르게 반복하고 있습니다."

포르투갈, AI 기반 챗봇 테스트 중

다른 나라에서도 생성적 AI를 기반으로 하는 시스템을 실험하고 있습니다.

포르투갈은 2023년에 결혼과 이혼과 같은 간단한 주제에 대한 기본적인 질문에 답하도록 고안된 챗봇인 Justice Practical Guide를 발표했습니다. 이 챗봇은 유럽 연합의 Recovery and Resilience Facility(RRF)의 자금으로 개발되었습니다.

130만 유로(140만 달러, 110만 파운드) 규모의 이 프로젝트는 OpenAI의 GPT 4.0 언어 모델을 기반으로 합니다. 결혼과 이혼을 다루는 것 외에도 회사 설립에 대한 정보도 제공합니다.

포르투갈 법무부의 자료에 따르면, 이 프로젝트가 시작된 후 14개월 동안 가이드를 통해 28,608개의 질문이 제기되었습니다.

제가 "회사를 어떻게 설립할 수 있나요?"라는 기본적인 질문을 했더니 좋은 성과를 보였습니다.

하지만 제가 더 까다로운 질문, 즉 "만 18세 미만이지만 결혼한 경우 회사를 설립할 수 있나요?"를 물었을 때는 그 질문에 답할 만한 정보가 없어 사과했습니다.

한 부처 소식통은 잘못된 답변이 드물기는 하지만 신뢰성 면에서 여전히 부족하다는 점을 인정했습니다.

"우리는 답변의 신뢰 수준이 결정적으로 높아짐에 따라 이러한 한계가 극복되기를 바랍니다."라고 소식통은 나에게 말했습니다.

콜린 반 노르트, 챗봇이 공무원을 대체해서는 안 된다고 주장

이러한 결함으로 인해 많은 전문가가 주의를 당부하고 있습니다. 콜린 반 노르트도 포함됩니다. "챗봇이 사람을 대체하고 비용을 절감하는 방법으로 배포되면 문제가 발생합니다."

그는 "추가 서비스, 정보를 빠르게 찾을 수 있는 방법"으로 보는 것이 더 현명한 접근 방식이 될 것이라고 덧붙였다.

뮌헨 루트비히 막시밀리안 대학교의 인공지능 윤리학 교수인 스벤 니홀름은 책임의 문제를 강조합니다.

그는 "챗봇은 공무원과 호환되지 않습니다."라고 말합니다. "인간은 자신의 행동에 대해 책임을 져야 하고 도덕적으로 책임을 질 수 있습니다.

"AI 챗봇은 자신이 하는 일에 대해 책임을 질 수 없습니다. 공공 행정에는 책임이 필요하므로 인간이 필요합니다."

니홀름 씨는 또한 신뢰성 문제를 강조한다.

"최신 유형의 챗봇은 기존 챗봇에서는 불가능했던 방식으로 지적이고 창의적이라는 환상을 만들어냅니다.

"이러한 새롭고 인상적인 형태의 챗봇은 때때로 어리석고 멍청한 실수를 합니다. 이는 때로는 유머러스할 수 있지만, 사람들이 챗봇의 추천에 의존한다면 잠재적으로 위험할 수도 있습니다."

에스토니아 정부는 채팅봇 활용을 선도하고 있습니다.

ChatGPT와 기타 대규모 언어 모델(LLM)이 중요한 조언을 제공할 준비가 되어 있지 않다면, 아마도 에스토니아에서 대안을 찾아볼 수 있을 것입니다.

공공 서비스를 디지털화하는 데 있어서 에스토니아는 선두 주자 중 하나였습니다. 1990년대 초부터 디지털 서비스를 구축해 왔고, 2002년에는 시민들이 국가 서비스에 접근할 수 있는 디지털 신분증을 도입했습니다.

따라서 에스토니아가 챗봇 도입의 최전선에 있는 것은 놀라운 일이 아닙니다.

현재 이 나라는 Bürokratt라는 이름으로 국가 서비스를 위한 일련의 챗봇을 개발하고 있습니다.

하지만 에스토니아의 챗봇은 ChatGPT나 Google의 Gemini와 같은 대규모 언어 모델(LLM)을 기반으로 하지 않습니다.

대신 그들은 최신 AI 흐름에 앞선 기술인 자연어 처리(NLP)를 사용합니다.

에스토니아의 NLP 알고리즘은 요청을 작은 세그먼트로 나누고, 키워드를 식별하고, 이를 통해 사용자가 원하는 것이 무엇인지 추론합니다.

Bürokratt에서는 각 부서가 데이터를 사용하여 챗봇을 훈련하고 챗봇의 답변을 확인합니다.

에스토니아 정보 시스템 기관의 개인 서비스 부서 책임자인 카이 칼라스는 "Bürokratt에서 답을 모르는 경우 채팅은 고객 지원 담당자에게 넘겨지고, 해당 담당자가 채팅을 인수하여 수동으로 답변하게 됩니다."라고 말했습니다.

NLP 모델은 인간의 말을 모방하고 언어의 미묘한 뉘앙스를 감지하는 능력에 한계가 있기 때문에 ChatGPT 기반 시스템에 비해 잠재력이 제한적입니다.

하지만 그들이 틀린 답변이나 오해의 소지가 있는 답변을 할 가능성은 낮습니다.

"일부 초기 챗봇은 시민들이 질문에 대한 옵션을 선택하도록 강요했습니다. 동시에 챗봇이 어떻게 작동하고 답변하는지에 대한 더 큰 통제와 투명성을 허용했습니다."라고 콜린 반 노르트는 설명합니다.

"LLM 기반 챗봇은 대화형 언어의 품질이 훨씬 더 높고, 더욱 섬세한 답변을 제공할 수 있습니다.

"그러나 이는 시스템 제어 능력의 저하라는 단점이 있으며, 같은 질문에 대해 서로 다른 답을 제공할 수도 있습니다."라고 그는 덧붙였다.

댓글