본문 바로가기
자유게시판

여자 월드컵의 '역설'

by godfeeling 2023. 9. 1.

당신이 22명의 다른 사람들과 함께 방에 있다면, 그들 중 두 사람이 생일을 공유할 가능성이 더 높습니다.

최근 호주에서 열린 여자월드컵에는 뭔가 이상한 점이 있었다. 주의 깊게 관찰했다면 발견했을 수도 있습니다. 많은 국제 팀에는 연중 같은 날에 태어난 선수가 있었습니다. 즉, 생일이 같은 선수들이 있었습니다.

무슨 일이 있었 니?

수학자들이 우리의 기대를 혼란스럽게 하기 위해 사용하는 " 생일 문제 " 또는 "생일 역설" 로 알려진 반직관적인 현상이 있습니다 . 문제는 일반적으로 다음과 같이 표현됩니다. "최소 두 사람이 생일을 공유할 확률이 50% 이상으로 높아지려면 모임에 몇 명이 참석해야 합니까?"

일반적으로 사람들이 이 문제를 처음 접하면 180일 정도 통통해집니다. 이는 일년 중 일수의 대략 절반에 해당합니다. 우리는 방에 틀어박혀서 다른 사람이 우리 생일과 일치할 확률을 생각하는 경향이 있기 때문입니다. 180은 사실 너무 많은 것 같아요.

생일이 일년 내내 대략 균등하게 분포되어 있다고 합리적으로 가정하면 답은 23명 입니다 . 그 이유는 생일이 특정 날짜에 해당하는 것이 아니라 단지 일치하는 것이 있다는 사실에만 관심이 있기 때문입니다. 39명이 모일 때쯤에는 확률이 거의 90%로 올라갑니다(아래 그래프에서 볼 수 있듯이).

사람 수가 늘어날수록 생일 일치 확률이 급격히 높아집니다. (제공: Kit Yates/BBC)

필요한 숫자가 왜 그렇게 낮은지에 대한 통찰력을 얻으려면 방에 있는 사람들의 쌍 수를 고려하는 것부터 시작할 수 있습니다. 결국 생일이 같은 쌍의 쌍이 질문의 내용입니다. 방에 23명이 있으면 그들을 쌍으로 결합하는 방법은 253가지가 가능합니다(아래 다이어그램 참조). 일치 확률에 대한 정확한 계산은 약간 복잡하지만 아마도 – 일단 23명의 개인이 253쌍을 생성한다는 것을 알게 되면 – 생일이 같은 적어도 한 쌍의 확률이 50% 이상으로 증가한다는 사실은 덜 놀라운 일이 될 것입니다. . 50명이 넘으면 두 사람이 생일을 공유할 확률은 97% 이상으로 높아진다.

한 방에 23명이 차례로 악수를 한다면 매우 빠르게 많은 수의 악수를 할 수 있게 됩니다. (제공: Kit Yates/BBC)

이론상으로는 너무 많은데 실제로는 효과가 있나요? 2023년 여자 월드컵에는 32개 팀이 참가했으며 각 팀에는 정확히 23명의 선수가 참가했습니다. 이론을 위한 완벽한 테스트 베드입니다.

데이터를 분석하여 32개 팀 중 17개(즉 절반 이상)에 생일이 같은 선수가 최소 2명 이상 있다는 사실을 알아냈습니다. 완벽하지는 않지만 실험을 여러 번 반복할 경우 평균적으로 기대할 수 있는 대략 16개에 매우 가깝습니다.

흥미롭게도 파나마의 카르멘 몬테네그로(Carmen Montenegro)와 리네스 세데뇨(Lineth Cedeño)만이 같은 해 정확히 같은 날(2000년 12월 5일)에 태어났습니다. 3개 팀(브라질, 콜롬비아, 덴마크)은 2쌍의 생일을 공유했고, 2개 팀(모로코와 나이지리아)은 3쌍의 생일을 가졌습니다. 생일이 크리스마스인 나이지리아 출신의 Glory Ogbonna와 Christy Ucheibe 쌍은 전체 팀에서 두 번째로 흔한 생일을 갖고 있으며, 총 7명이 생일을 공유합니다. 두 번째 준결승에서는 또 다른 생일 짝이 서로 대결했습니다 . 늦게 교체된 알렉스 치디악(호주)과 클로이 켈리(잉글랜드)의 생일은 1월 15일로, 켈리는 상대보다 정확히 한 살 더 많습니다. 잉글랜드 미드필더 Jordan Nobbs와 그녀의 상대 스페인 공격수 Esther Gonzalez는 정확히 같은 날(1992년 12월 8일) 태어났습니다. 스쿼드에 포함되었음에도 불구하고, 잉글랜드가 월드컵 결승전에서 스페인과 맞붙을 때 두 사람 중 누구도 경기장에 나서지 못했습니다.

생일 유형의 문제로 인해 발생하는 수많은 쌍별 조합은 종종 겉보기에 있을 것 같지 않은 사건이 순전히 우연히 발생하도록 하는 원동력이 됩니다.

전체적으로 나는    내에서 24쌍의 생일을 식별했습니다(우연히 매직 넘버인 23을 약간 넘음). 따라서 동일한 "생일 추론"은 이 날짜에도 한 쌍의 쌍이 있을 가능성이 더 높다는 것을 암시합니다. 실제로 3월 3일은 덴마크 선수(Simone Boye Sørensen과 Luna Gevitz)와 콜롬비아 선수(Sandra Sepúlveda와 Diana Ospina Garcia)의 생일입니다. 3월 3일은 모든 스쿼드에서 가장 인기 있는 생일이며, 총 9명의 선수가 해당 기념일을 공유하는 것으로 나타났습니다.

축구를 제외하고, 동일한 "생일 문제" 추론은 다른 분야에서 보이는 역설을 설명하는 데 도움이 될 수 있습니다. 2001년에 과학자들은 65,493개 샘플로 구성된 애리조나주의 DNA 데이터베이스를 검색하던 중  관련이 없는 두 DNA 프로필 사이의 부분적인 일치를 발견했습니다 . 서로 관련이 없는 두 명의 개인에 대해 우리는 샘플링된 프로필 3,100만 쌍당 대략 한 번씩만 이 수준의 일치를 기대할 수 있습니다. 연구원들이 과학 회의에서 발표한 이 충격적인 발견은 더 많은 가능한 일치를 검색하도록 촉발했습니다. 모든 데이터베이스의 프로필을 비교한 결과 유사하거나 훨씬 더 유사한 정도의 유사성을 지닌 122쌍의 개인이 식별되었습니다.

월드컵 선수 Simone Boye Sørensen, Luna Gevitz, Sandra Sepúlveda 및 Diana Ospina Garcia는 모두 같은 생일을 공유합니다(3월 3일).

이 연구를 바탕으로 DNA 식별자의 고유성을 의심하는 미국 전역의 변호사들은 1,100만 개의 샘플이 포함된 국가 DNA 데이터베이스를 포함하여 다른 DNA 데이터베이스에서도 유사한 비교가 이루어져야 한다고 주장했습니다. 65,000명 정도의 작은 데이터베이스에서 122개의 일치 항목이 발견되었다면 인구가 3억 명인 국가에서 DNA를 사용하여 용의자를 고유하게 식별할 수 있을까요 ? DNA 프로필과 관련된 확률이 정확하지 않아 전국적으로 DNA 기반 유죄 판결의 안전이 위험해졌습니까? 일부 변호사들은 그렇게 믿었고 심지어 피고인의 재판에서 DNA 증거의 신뢰성에 의문을 제기하기 위해 애리조나 조사 결과를 증거로 제출하기도 했습니다.

실제로 애리조나 데이터베이스에 있는 65,493개의 샘플을 서로 비교하면 총 20억 개가 넘는 고유한 샘플 쌍이 생성된다는 사실을 알아낼 수 있습니다. 관련되지 않은 프로필 3,100만 쌍당 하나의 일치 확률로 68개의 부분 일치가 예상됩니다. 예상되는 68개의 일치 항목과 발견된 122개의 일치 항목 사이의 차이는 데이터베이스에 있는 가까운 친척의 프로필로 쉽게 설명될 수 있습니다. 친척의 프로필은 관련이 없는 개인의 프로필보다 부분적으로 일치할 가능성이 훨씬 더 높습니다. DNA 증거에 대한 우리의 신뢰를 흔들기보다는 데이터베이스 결과는 "생일" 수학과 아주 잘 일치합니다.

생일 유형의 문제로 인해 발생하는 예상외로 많은 수의 쌍 조합은 겉으로 보기에 있을 것 같지 않은 사건이 순전히 우연히 발생하도록 허용하는 엄청난 수의 가능성 뒤에 있는 원동력이 되는 경우가 많습니다. 이와 같은 상황에서는 사건이 발생할 가능성이 충분할 때 그 중 어느 하나라도 발생할 가능성이 낮아 보이더라도 함께 보면 불가능해 보이는 사건도 압도적으로 가능성이 높아질 수 있다는 점을 기억할 가치가 있습니다.

댓글