首先说明下,语料库全部词条已经免费上传至云端,后续我们也将会一直保持开放状态,至于独立的数据词库 (.tmx) 翻译记忆库文件,暂不提供公开链接下载,原因就不多说,继续往下看。
此 WordPress 翻译记忆库中的全部词条内容是由薇晓朵及文派翻译 (WP Chinese Translation) 团队提供。
一、如何获取?
1 、如果你是教育或科研机构,可联系薇晓朵客服获取免费版的 WordPress 行业中文 TMX 语料库文件 (近 25 万词条) 仅简体,对于商业使用,只需告知具体用途和进行权利确认即可。
2 、如果你是商业组织及同行,我们接受项目合作及采购,WordPress 行业中文翻译词库已有近百万词条语句 (仅简体,含繁体为两百多万条),包含了薇晓朵 2012 ~ 2022 年这十年间的全部人工校对翻译词条。
商业翻译包含了薇晓朵全部 WordPress 商业项目翻译词条,整体词库采购的基础费用在五位数以上,如有需要,也可提供独立翻译系统和托管式长期订阅服务,非诚勿扰。
3 、如果你是普通用户和爱好者,那么只需要下载 Poedit 软件,按照正常工作步骤去翻译你需要的主题插件即可,不出意外,未来的一段时间里,你能获取到很多的精准翻译建议词条,大部分将会是来自文派翻译。
二、为何发布?
免费提供的语料库是所有用户都可以在 WordPress.org / WordPress 翻译 (WPfanyi.com) 站点公开下载的免费主题、插件的整体翻译记忆语料库。经过测试,新主题插件翻译的准确度可以达到 85% 以上相对来说质量还是不错的,并且最重要的这是纯净且未被污染的新数据库。
对于普通用户来说实际上影响并不大,我们做此次操作的目的在于去稀释掉去年被破坏的 WordPress 在线协同词库,20 万条词库说多不多,说少也不少,事实上,由于 WordPress 行业圈子太小,国内外也不会有第二个如此巨量且高精度的人工校对语料库。
三、从何而来?
要说这么多词条 100% 都是薇晓朵原创翻译的就有些吹嘘了,也不切实际,100 多万条词库大概有 60% 是源于过去十多年的人工翻译积累,剩下的一些其实是通过收集和机器模糊翻译+人工匹配而来,也就是说这里面我们不会保证 100% 的精准度,但 85% 以上的准确度还是有的。
使用我们的翻译记忆库,如果是翻译 WordPress 主题插件的话,那么过去人工手动需要 5 小时的工作,可能你在 5 分钟内就能完成。
另外说下,去年我们关闭了商业翻译库的 WordPress 词条贡献后就已经自建了翻译服务器。
同时这次也思考权衡了很久,不公开语料库的下载地址,是不想这次新贡献的这 20 多万条人工翻译又被玩坏了,至于后续的翻译效果和效率改善有无,我也就拭目以待吧。
发表回复