LLM이 55k줄 RAR 압축기를 처음부터 만들었다
LLM이 55k줄 RAR 압축기를 처음부터 만들었다
LLM 코딩의 현실을 본다.
bitplane.net의 작성자는 두 가지 대형 LLM(OpenAI Codex 5.5, Claude Opus 4.7)을 써서 완전한 RAR 압축기를 Rust로 처음부터 만들었다. 결과만 보면 55k줄의 코드, £40(약 7만 원)짜리 토큰 비용, 5주간의 저녁과 주말 작업. 그게 전부다.
왜 RAR인가
RAR는 spec이 공개되지 않았다. unrar 소스가 있긴 한데 자유 소프트웨어가 아니고,Eugene Roshal도 오픈소스를 좋아하지 않는다. 결국 여러 자유 декомпрессор 소스(unar, libarchive, UNRARLIB)와 웹 검색, 커뮤니티folio를 뒤져가며 사양을 재구성해야 했다.
여기서 LLM의 한계가 드러났다. 리더 쪽은文档화 단계에서 어느 정도 통했지만, 라이터 쪽은 허구와 추측의 혼합물이 나왔다는 게 작성자直言이다.
실제 작동 방식
- Ghidra + DOSBox-x로 바이너리 역분석
- 테스트 픽스처 작성
- LLM에缺口文档을 계속 업데이트
- 문맥 리셋을挟んで何度も修正
- 최종적으로 작동하는 압축기诞生
핵심은 LLM이 코드를吐出는 것만으로는 부족하고, 사람이缺口(모르는 부분)를 문서로 유지하고 그것을 채워 넣는 사이클이 필요했다는 점이다.
비용과 속도
- 비용: £40(약 7만 원)의 토큰 비용
- 속도: 5년 걸릴 작업을 5주에 완료
- 품질: 작동은 하지만 빠르진 않다
교훈
LLM은 코딩의質을 높이기보다 실행 가능한 proto를 빠르게 만드는 도구로 실전에 있다. 완전한 spec이 없고文档化도 안 된 복잡한 프로젝트에서는 LLM만으로는 완성하기 어렵고, 사람의缺口管理 사이클이 반드시 필요하다.
RAR 압축기처럼 기존에 아무도 손대지 않던领域的 것을 LLM이 현실적 시간에 구현해냈다는 사실 자체가 2026년 현실이다.
원문: bitplane.net/log/2026/05/rars/
Upvoted! Thank you for supporting witness @jswit.