无论是从事翻译工作, 还是进行写稿创作, 亦或是开展资料整理工作, 在多场景文本转换时, 最怕的便是出现“翻车”状况, 诸如数据串行、标点符号混乱、格式完全崩坏等情况。我自身曾经历过无数次此类陷阱, 今日就将那些直接可拿来运用的、能够提升精准度的技巧分解展现给你瞧。
必然你碰到过这般情形: 去复制一段文字, 粘贴过后全都是问号或者方块。这并非是你个人实施的那番操作出现了问题, 而是原本的文本自身存在着“病症”。我在最开始的时候并不明白, 后续发觉有几个细节极为有用。
操作步骤:
1. 首先, 要通读原文, 接着, 将肉眼能够看见的特殊符号, 像是全角空格、奇怪的引号, 手动去替换成普通符号。
2. 把所有格式“清洗掉”, 用记事本或者纯文本编辑器临时粘贴一回。
3. 再把干净的文字复制到目标工具里转换
出现过這樣的情況, 有一回將PDF中的表格進行轉換, 因未提前做好檢查, 致使往其他地方進行粘貼操作曆, 數字隨同文字混雜在了一起。此後養成特定習慣, 即先使用記事本對其進行一遍處理, 如此至少能夠節省半小時用於改正錯誤的時間。
掌握使用技巧,大幅提升学习、工作、外贸场景转换效果;设置语种切换简化翻译流程可查看:易翻译怎么快速切换语种?默认设置一劳永逸
操作步骤:
1. 文字翻译的场景之下, 要优先采用专门的术语库工具, 像是Trados或者MemoQ这样的, 千万不要使用通用翻译器, 是这样的一种情况。
2. 在格式转换场景之中, 像把PDF转换成Word这种情况, 可运用Adobe Acrobat或者ABBYY来达成, 尽量减少使用免费的在线工具。
3. 用于数据提取的场景(像是表格转化为文本这种情况)当中: 先借助Excel或者WPS来对数据实施清洗操作, 之后再导出成为纯文本。
可选工具(按需求挑):
纯文字转换:记事本、Sublime Text
格式保持:Adobe Acrobat、WPS专业版
批量处理:Python脚本(不会写就找现成的在线工具)
说一下踩坑的细节, 有一次我为了图省事, 采用了免费在线PDF转Word的方式, 然而转换完成之后, 字体全部发生了变化, 并且在表格里面还额外多出了十几个空行。后来我规规矩矩地安装了一个Acrobat, 虽说这是要花钱的, 但是从那之后一次问题都没有出现过。
文本进行转换期间, 最易于丢失的是序号、日期以及金额这类数字信息, 我起初在开展数据整理工作时, 时常出现账目对不上的状况, 后来发觉是转换进程里编号变得紊乱了。
操作步骤:
1. 正式转换前,先把所有数字、日期单独复制出来存一份备用
2. 完成转换之后, 凭借“Ctrl+F”迅速去搜索关键数字, 瞧瞧是不是仍旧在原来的位置上。
3. 如果发现偏差,立即中断转换,回到原始文件检查分隔符
格外着重记好, 表格当中的“序号”以及“合计”是最极易出错的, 在进行转换之前务必要亲自手动去标记此处位置。
详细的踩坑情况是这样的, 有一回进行1000多行的数据表转换, 转化完成之后序号直接从1跳跃到100, 中间的序号全部消失不见。后来我变得谨慎小心了, 每一次进行转换之前, 都会先把自己最为在意的3个数字进行截图保存, 通过对比可以迅速得出结果。

问:为什么我用记事本洗过一遍之后,格式还是乱?
呀, 回答是这样的, 考虑到原始文本之中极有可能隐匿着那些不可见的字符, 像比如说零宽空格这类, 你能够在文本编辑器那儿开启“显示所有字符”此项功能, 然后将它用手动的方式给删除掉。
问:转换后文字全挤在一起,像没分段一样,怎么办?
答: 很大概率是换行符的类型出现了不匹配的情况, Windows系统与Mac系统的换行符是不一样的, 当使用记事本进行另存为操作的时候选择UTF - 8格式, 基本上能够将问题解决。
问:有没有免费工具能保持格式不变?
答: Google Docs具备的“粘贴并匹配格式”这一功能是十分实用的,此外WPS所拥有的“选择性粘贴 - 纯文本”此项操作也是能够起到救急作用的。不要去期望达到完美的程度, 因为免费的工具多多少少是会丢失一些东西的。
如果想使得多场景下的文本转换具备较高的精准度, 实际上存在着三个要点: 在进行转换之前务必要对数据进行清理, 针对不同的场景选择运用各异的工具, 针对关键数字要提前做好备份。我在最初的时候也是经历了些许曲折的过程, 后来逐渐养成了一种习惯, 每当进行转换之前都会额外花费两分钟去开展准备工作, 而后续节省下来的时间往往能够达到十倍之多。当你下一次进行转换操作的时候, 可以尝试先进行文本的检查, 然后挑选出合适的工具, 如此一来精准度起码能够提升一半。
手动修正译文保证内容质量可参考:易翻译翻不对?自己动手修几招就准了