建立易翻译企业专属术语库需要按步骤来:先界定业务范围与目标语言,集中采集现有术语与上下文,统一命名规范与元数据字段,制定审核与放行流程,采用标准格式批量导入并与翻译记忆和机器翻译联通,最后建立维护计划与质量监控指标,持续迭代更新并向全员开放检索与反馈入口。

为什么要建企业专属术语库(用最简单的话解释)
想象一下,公司有一套“内部语言”:产品、合同、技术或市场用语常常有特定含义。没有统一术语,翻译出来可能意思不对、风格不一致,甚至影响法律或业务风险。术语库其实就是一部“公司辞典”,把这些词放进系统,并告诉翻译和机器翻译该怎么翻。
先把目标说清楚:范围与用途
开始之前,问两个最重要的问题:
- 我们要覆盖哪些场景?(产品说明、合同、客服对话、营销内容、研发文档等)
- 谁会用术语库?(内部译者、外包翻译、CAT工具、机器翻译后编辑、客服或销售)
把范围和使用者说清楚,会影响字段设计、审核流程和导入格式,比如客服更强调简短口语译法,合同需要法律一致性和批准记录。
逐步构建流程(按费曼法把复杂的事拆成小块)
1. 信息收集:把“所有”术语找出来
这一步像捡石头:别挑好挑坏,先全捡上来。来源包括:
- 现有翻译记忆(TM)与术语库导出
- 产品说明书、用户手册、合同模板
- 内部知识库、FAQ、客服话术
- 研发、法务、市场、销售的术语表或Excel
最好附带上下文(句子或段落),因为同一个词在不同上下文可能要不同译法。
2. 甄别与分类:哪些词进库,哪些不进
不是所有词都值得成正式术语。设定判断标准:
- 是否经常出现(频率)
- 是否存在较高翻译风险或歧义
- 是否影响法律、合规或用户体验
- 是否是品牌名、专有名词或固定短语
按优先级标签(高/中/低)来分类,先做“高优先级”批次导入与审核,能最快看到效果。
3. 定义词条结构(这是核心)
词条要标准化。一个清晰的字段集合,让人和机器都能读懂。常见字段包括:
- 源词(原语言形式)
- 目标译文(每种目标语言的一行或多行)
- 词性/类型(名词、动词、短语、品牌名)
- 上下文示例(出现的句子或说明)
- 用法说明(何时使用/何时禁用)
- 优先级/重要性
- 批准人(谁定稿)和批准日期
- 版本号/变更记录
- 域/场景标签(产品、法律、市场)
- 同义词/变体
示例词条表格(样例)
| 源词 | 译文(英文) | 类型 | 上下文 |
| 订单号 | Order ID | 专有名词/简称 | 用户在支付页看到“订单号:12345” |
| 激活 | Activate / Activation(视上下文) | 动词/名词 | “请激活设备” → 动词;“激活码” → 名词 |
4. 审核与批准流程(别偷这步)
把术语放进系统前必须“盖章”。流程建议:
- 初审(语言团队或术语管理员)
- 领域专家复核(产品、法务、市场)
- 最终批准(责任人签字/线上确认)
- 记录批准人和时间、给出变更理由
把责任人和 SLA 写清楚,比如“领域专家在5个工作日内回复”,避免长期堵在审批环节。
5. 格式化导入:用机器能懂的表格
术语库通常需要导入到易翻译或其他翻译工具。常见做法:
- 首选 CSV 或 Excel(列头严格按字段设计)
- 针对 CAT 工具或平台,支持 XLIFF 或 TBX(如果有)
- 每行一条词条,必要时用多行或分组存储多语种译文
- 导入前做小批量测试,检查编码(UTF-8)、分隔符、引号问题
示例CSV列头(建议)
| source_term | target_en | term_type | context | priority | approver | domain |
| 订单号 | Order ID | 专有名词 | 支付页 | 高 | 张三 | 交易 |
技术集成:和翻译记忆、机器翻译打通
术语库的价值在于能被自动使用。
- 和翻译记忆(TM)联合:在 CAT 工具或易翻译系统中优先匹配术语,避免被句对句翻译覆盖。
- 给机器翻译喂术语:现代平台支持术语约束或术语表导入,强制或建议 MT 在译文中采用指定译法。
- API/实时查询:如果客服系统或产品后台需要自动翻译,可通过术语API实现即时校正。
治理与日常维护(有人负责就不会烂尾)
术语库不是一次性工程,必须有长期治理:
- 指定术语管理员(1-2人)负责日常录入、分类、导入和培训
- 建立变更流程:谁能提议、谁能批准、如何回退
- 定期清理和合并重复项,避免多版本并存
- 用版本管理记录每次变更,保存历史以便追溯
培训与推广
没有人用,再好的术语库也白搭。要:
- 给译者、外包方、产品和客服开短培训(30-60分钟),演示如何检索与提交新词
- 写一个轻量操作手册,放到内部知识库
- 做快捷搜索入口(企业内易翻译客户端或浏览器书签),让使用更方便
质量监控与指标(量化成效)
用数据说话,常见指标包括:
- 术语覆盖率:文档中术语命中的比例
- 术语一致率:相同词在不同文本中的译法一致程度
- 审阅返工率:含术语的译文被退回修改的次数
- 使用频率:哪些术语被检索或引用最多
- 批准时长:从提交到批准的平均时间
把这些数据放到月报或季度报,既能推动改进,也能证明投入产出比。
实际操作清单(一步步来做)
- 第0步:指定项目负责人与领域专家名单
- 第1步:导出现有TM和所有相关文档;收集Excel/Word术语表
- 第2步:合并、去重、把上下文一并导入暂存表
- 第3步:按优先级制定初始批次(例如首月处理500条高优先级)
- 第4步:语言小组初审,领域专家复核,管理员录入正式字段
- 第5步:小批量导入易翻译测试环境,验证与MT/TM联动效果
- 第6步:上线并推广,收集使用反馈与新增词
- 第7步:每月一次维护、每季度一次评估并汇报
常见问题与坑
说到这儿,顺便提醒一些实操中常见的“坑”:
- 没有上下文就定译法:容易出错。一定要保存示例句。
- 审批流太复杂:会导致停滞,设置合理的 SLA 很重要。
- 术语版本失控:没有变更记录,历史翻译就无法自洽。
- 与MT/TM不同步:导入后忘记刷新缓存或重训练,会导致旧译法继续出现。
- 缺少推广:内部没人用,维护成本反而起不来收益。
工具与格式建议(实用)
如果要跟系统对接,建议优先采用:
- CSV/Excel(最通用):UTF-8 编码,列头规范化
- TBX(Terminological Markup,若需要交换术语库)
- XLIFF(与翻译流程结合时使用)
- API 接口(实时查询与更新)
把人和流程放在技术之前(真的很关键)
术语库不只是数据库,它是“人+流程+技术”的产物。有人负责、流程清晰、工具可用,才能把这个东西变成帮助业务的工具而不是管理负担。别指望一次性把所有问题都解决,先做一个小范围的 MVP,尽快让实际用户跑起来,再扩展到全公司。
有些细节,总结成一句话容易被当作结论,其实我就是想说:开始要动手,别等完美的规范,术语库的真正价值在于被使用和不断修正。这一套方法按步骤走,你会发现翻译质量和工作效率都会慢慢稳住。好了,我先写到这儿,回头还想补几个常见模板例子,留着下次说。