"내 평생 들어본 가장 멍청한 아이디어."

요약

1993년 어도비가 PDF를 처음 내놓았을 때 가트너의 한 컨설턴트가 남긴 말입니다. 전화선 인터넷으로 메가바이트짜리 파일을 다운받아야 했으니 틀린 말은 아니었습니다. 어도비 이사회조차 프로젝트를 접고 싶어 했고요. 하지만 디지털 파일 공유가 일상이 되면서 PDF는 살아남았고 지금은 전세계적으로 2조 5천억 개 이상의 PDF파일이 존재할 만큼 표준이 됐습니다.

그런데 이제 AI가 PDF를 잘 읽지 못한다는 게 문제가 되고 있습니다. 다단 레이아웃을 엉뚱한 순서로 읽거나 머리말과 꼬리말을 혼동하면서, AI 환각 현상의 원인 중 하나가 되고 있다는 거죠. 팩티파이(Factify) 같은 스타트업은 AI에 맞는 새 형식으로 대체하겠다고 나섰고, 어도비와 구글은 PDF를 더 잘 읽게 만드는 쪽으로 대응하고 있습니다.

담은순간들 생각

1993년의 가트너 컨설턴트는 당시 기준으로는 맞았습니다. 느리고 무겁고 불편했으니까요. 다만 보지 못한 게 있었어요. 태풍이 오고 있다는 것. 인터넷이 전화선에서 초고속으로 바뀌고 미국 국세청이 PDF를 공식 양식으로 쓰기 시작하면서 결국 아무도 불편하다고 하지 않게 됐습니다.


저도 비슷한 문제를 겪어봤습니다. PDF를 AI로 읽으려고 이것저것 시도해봤는데, 텍스트 추출이 깨지고 표가 뭉개지고 다단 레이아웃이 엉키더라고요. 한글 파일(hwpx)은 말할 것도 없고요. 한동안은 해결책을 찾아 이 도구 저 도구 옮겨 다녔습니다.

그런데 요즘은 그냥 기다리고 있습니다.

한 개발자가 비슷한 취지의 말을 한 적이 있는데 저는 그걸 '2개월짜리 문제'라고 부릅니다. 지금 안 풀리는 기술적 문제가 있어도 억지로 풀지 말고, 2개월만 기다리면 모델이 업데이트되면서 해결된다는 거예요. PDF에서도 어도비와 구글이 이미 움직이고 있고요. hwpx 파일은 제미나이를 기점으로 클로드도 이제는 잘 읽죠. 방향이 보이고 남들도 달려드는 문제라면, 굳이 직접 해결하려 애쓰기보다 기다리는 것도 전략이지 않을까 합니다.

생각거리

PDF만의 이야기는 아닌 것 같아요. 최근 'SaaSpocalypse'라는 말이 돌고 있는데, AI가 기존 소프트웨어의 기능을 직접 해내기 시작하면서 구독형 소프트웨어(SaaS) 산업 전체가 흔들리고 있다는 거예요. 그동안 당연했던 것들이 '종말'이라는 선언 앞에 놓이고 있습니다.

그런데 AI로 만들 수 있다는 것과, 오랜 시간의 검증을 거친 것들이 실제로 교체되는 건 꽤 다른 문제인 것 같아요. 2조 5천억 개의 PDF, 그 위에 수십 년째 얹혀 있는 기업 시스템이 그렇게 쉽게 걷어지진 않을 테니까요.

구독하시면 새롭게 담기는 이야기들을 가장 먼저 메일로 받아보실 수 있습니다.

오늘 본 것 #3 — '멍청한 아이디어'가 표준이 되기까지

"내 평생 들어본 가장 멍청한 아이디어." 그런데 태풍이 왔고, 아무도 불편하다고 하지 않게 됐습니다. 지금 '끝이다'라는 선언 앞에 놓인 것들도 그렇게 쉽게 걷어질까요.