Safew通常接收并翻译各类可编辑与非可编辑文件:Office文档(.docx/.xlsx/.pptx)、PDF、网页与数据文件(.html/.xml/.json)、本地化中间格式(XLIFF/.po/.tmx)、桌面排版文件(InDesign idml/indd)、图片/扫描件(jpg/png/tiff/pdf扫描)、字幕(.srt/.ass/.vtt)、软件资源(.resx/.properties/.strings.xml)以及压缩包(.zip/.rar)。遇到专有或二进制格式,建议先与项目经理确认并提供可导出的源文件或替代格式。

先说一句为什么要关心格式
很多人觉得“上传一个PDF就行了”,但格式其实决定了翻译效率、质量和成本。把可编辑源文件提供给翻译团队,就像给厨师准备好切好的食材,节省重复劳动(转换、排版、校对)也降低出错率。此外,不同格式在交付时对排版、换行、变量(比如软件字符串中的 %s、{0})的处理也不同,处理不好会导致最终产品出问题。
Safew一般支持的文件类型(按用途分类)
下面把常见格式按用途分组,方便你一眼找到该怎么准备文件:
办公与文档类(优先可编辑格式)
- Microsoft Office:.docx .doc .xlsx .xls .pptx .ppt — 推荐提供最新的可编辑格式(docx/xlsx/pptx),便于保留样式与表格。
- OpenDocument:.odt .ods .odp — 若源文件来自开放套件,保留原格式更好。
- PDF:可分为“可编辑PDF”(含文本层)和“扫描PDF”。可编辑PDF通常可直接翻译或先导出为Word;扫描PDF需要OCR,成本与错误率会提高。
网页与数据文件
- 网页/标记:.html .htm .xhtml — 支持直接翻译页面内容,最好一并提交CSS/图片资源以便上下文检查。
- 结构化数据:.xml .json .yaml — 常见于应用、本地化项目,*建议*提供格式说明或示例以免误译字段名。
本地化与翻译工具中间格式
- XLIFF:.xlf .xliff — 专为本地化设计,保留上下文与段落单元,是与CAT工具互通的首选。
- PO、MO:.po .pot — 常见于开源项目(gettext)。
- TMX:.tmx — 翻译记忆导入导出格式。
桌面排版与印刷
- Adobe InDesign:.idml(首选) .indd(原生) — idml更易交换,indd可能需要特定版本或IDML导出。
- Illustrator/Photoshop:.ai .psd — 对图层、文字路径的处理需提前确认。
图像与扫描件
- 位图:.jpg .jpeg .png .tiff .bmp — 文字在图片中时需OCR;请同时提供高分辨率源文件与原始文本(如果有)。
- 扫描PDF:建议提供可检索文本或让服务方先执行OCR以评估可译性。
多媒体与字幕
- 字幕:.srt .ass .ssa .vtt — 常用于视频本地化,保留时间码很重要。
- 多媒体交付:通常为视频文件(.mp4 .mov)配合字幕文件或时间轴文件(.eaf、.scc),翻译时需要明确是否要重嵌字幕。
软件与资源文件
- 资源:.resx .properties .strings .stringsdict .arb — 各平台常见资源文件。
- 工程文件:Android的.xml(strings.xml)、iOS的.strings、各类PO / POT等。
以表格形式快速浏览(常见扩展与备注)
| 类型 | 扩展名 | 说明 / 建议 |
| Office 文档 | .docx .xlsx .pptx | 优先提供可编辑源文件,保留样式与表格。 |
| 可编辑 PDF | 若含文本层可直接处理;扫描件需OCR。 | |
| 本地化格式 | .xlf .po .tmx | 与CAT工具互通,便于保持术语与记忆库。 |
| 网页 / 数据 | .html .xml .json | 提供结构化文件有助于自动化处理并减少人工错误。 |
| 桌面排版 | .idml .indd | IDML 更通用;复杂版式可能需DTP服务。 |
| 多媒体 / 字幕 | .srt .ass .vtt .mp4 | 保留时间码;明确目标嵌入方式。 |
| 图片 / 扫描 | .jpg .png .tiff | 提供高分辨率;必要时提供原始文本或OCR结果。 |
一些细节与现实操作建议(费曼式解释,越简单越好)
如果你把文件交给翻译公司,想象两种场景:一是“厨师拿到切好的材料”,二是“厨师得先去砍、去剥、去切”。可编辑的源文件就是切好的材料。为什么重要?三点:一,速度快;二,准确(格式化文本、表格、代码片段不会错位);三,成本低(少了排版和重构步骤)。
准备文件的实用清单
- 优先提供可编辑文件(.docx/.xlsx/.pptx/.idml/.xlf等)。
- 若只有PDF,尽量提供带文本层的PDF或额外的Word版本。
- 软件字符串请提供注释或上下文(哪个界面、变量含义)。
- 图片中的文字应提供原始文本或单独导出的文本清单。
- 复杂排版(手册、目录)建议一并提交源InDesign文件及字体。
- 如果有术语表、参考文档或已有翻译记忆(TMX),请一并提交。
关于专有与二进制格式
一些专有格式(某些旧版工程文件、专用软件的二进制包)可能无法直接打开。这种情况下有三条常用路径:
- 由客户导出成通用格式(如IDML、XLIFF、XML或CSV)。
- 由服务商在本地安装对应软件进行导入与导出(需版本匹配)。
- 把内容导出为结构化文本或表格,人工对齐后翻译(较费时)。
传输方式与注意事项
通常项目文件可通过以下方式发送:安全云盘(推荐)、客户门户、企业FTP或压缩包邮件。无论哪种方式,请注意:
- 标明文件名规则与交付语言(例如:UI_en-US.docx -> UI_zh-CN.docx)。
- 若包含机密信息,事先签署保密协议(NDA)。
- 一次性上传过大文件可以分卷或提供下载链接并注明有效期。
错误与常见问题(别慌,提前规避)
- 上传扫描PDF却期望可直接复制文本:OCR会出错,影响质量。
- 只提供截图、图片而没有文字版本:翻译效率低,费用可能上升。
- 不提供上下文(界面位置、目标用户群):容易出现用词不当。
- 特殊占位符(%s、{0})被误改:需要在交付说明里强调占位符规则。
如果你不确定文件是否支持,怎么做?
三步走:1)把文件名和扩展发给项目经理;2)附上你能提供的背景(目标语言、用途、排期);3)询问是否需要导出成XLIFF或IDML等中间格式。大多数翻译团队会给出明确可行的处理方案(例如先做OCR、或要求你导出IDML)。
小提示(真实操作中经常被忽略的事情)
- 字体问题:若你提供的是含特殊字体的排版文件,最好同时打包字体或转为曲线(注意可编辑性与版权)。
- 表格与公式:复杂公式在Excel/Word中可能会丢失,建议导出为MathML或给出可编辑源。
- 日期/货币/测量单位:说明目标市场偏好(比如美式/欧式日期、千位分隔符)。
- 多语种同一文件:若原文包含多语言(例如双语手册),请说明源语言段落边界或拆分文件。
结尾随想(就像和你在电话里聊到一半)
总的来说,把可编辑的、结构化的源文件交给翻译方,会让一切变得顺畅——时间、钱和最终体验都会更省心。如果遇到奇怪的专有格式,不必着急,先和项目经理沟通导出方案或转换流程。对了,记得提供术语表和上下文,那些小东西真的能省下不少后期返工的时间(我自己项目里就踩过几次坑)。