Posts

Showing posts from April, 2026

Chinese PDF text shows ☒ but copies fine — what’s actually going on?

Image
r/techsupport에서 올라온 원본 오류 메시지입니다. 사용자가 "데이터" 자체는 손상되지 않았지만(메모장에 복사 가능) "시각적 요소"가 깨졌다는 점을 정확하게 지적한 것을 주목하세요. 이는 CMap/ToUnicode 테이블 손상의 전형적인 증상입니다. 최근 레딧에서 흥미로운 사례를 접했습니다. 어떤 사람이 아크로뱃의 "텍스트 추가" 도구를 이용해 스캔한 PDF 파일에 티베트어, 영어, 중국어를 섞어 메모를 추가하고 있었습니다. 처음에는 모든 것이 정상적으로 보였지만, 나중에 중국어 텍스트 대부분이 갑자기 네모(☒)로 바뀌었습니다. 이상하게도, 같은 텍스트를 복사해서 일반 편집기에 붙여넣으니 글자가 전혀 문제없이 나타났습니다. 언뜻 보면 일반적인 인코딩 문제처럼 보입니다. 하지만 이러한 동작은 좀 더 구체적인 문제를 시사합니다. 데이터 자체는 그대로 있지만, 렌더링에 문제가 있는 겁니다. 여기서 핵심 단서는 간단합니다. 👉 복사 붙여넣기가 성공하면 텍스트 데이터는 손상되지 않은 것입니다. 즉, 다음과 같은 의미입니다. 유니코드 매핑(ToUnicode)은 여전히 ​​유효할 가능성이 높습니다. 문제는 렌더링 단계에서 발생하고 있습니다. PDF 용어로 설명하자면, 일반적으로 다음과 같은 의미입니다. 👉 파일은 텍스트가 무엇 인지는 알지만, 어떻게 그려야 할지는 모릅니다. 따라서 충돌이 발생하는 대신 기본 "notdef" 기호(☒)로 되돌아갑니다. 왜 중국어 텍스트만 있나요? 바로 이 지점에서 글꼴이 중요해지기 시작합니다. 티베트어/영어 → Microsoft Himalaya(최신 OpenType) 중국어 → Adobe Song Std L (기존 CID 키 방식 글꼴) 그 차이는 상당합니다. 기존의 CID 기반 글꼴은 CMap(문자 매핑 테이블)에 크게 의존합니다. 매핑이 잘못 정렬되거나 부분적으로 손실되면 기본 텍스트가 여전히 유효하더라도 렌더링 프로그램이 올바른 글리프를 찾지 못할 수...

Why Adobe Reader Shows a “Web Browser” Error (Even When You're Not Using One)

Image
This issue occurs when different types of PDFs (static and XFA forms) are opened together in Adobe Reader. Why Adobe Reader Shows a “Web Browser” Error (Even When You're Not Using One) Recently, I came across a strange issue with PDF files. Individually, the files opened just fine. But when certain combinations were opened together, an unexpected error appeared. This PDF file contains special features and it won’t work in a web browser. The confusing part? The files were being opened in Adobe Reader—not a web browser. A Strange Pattern The issue followed a very specific pattern: PDF 1 + PDF 4 → Works fine PDF 2 + PDF 3 → Works fine PDF 1 + PDF 2 → ❌ Error appears This suggests the files themselves are not corrupted. Instead, the issue lies in how they interact. The Hidden Difference Between PDFs Not all PDFs are the same. There are two main types: Standard PDFs (Static) – Fixed layout, used for viewing or printing XFA PDFs (Dynamic Forms) – Inter...