免费的通义,竟然这么强
之前给大家分享过一个非常好用的 OCR 工具,在「文字识别提取」这件事上,它的识别精准度确实没得说,非常厉害。
还没有看到的,可以戳这里《号称世界上最好的OCR(文本识别)工具:Mistral OCR,普通人也能用》去看原文。
但最近,我遇到了一个更复杂的场景,需要翻译一份十几页的英文文档,PDF格式的。
用之前的 Mistral OCR 工具,确实能把文字都提取出来,但是需要每次单独进行截图,直接上传文档,经常识别失败。
就在我准备硬着头皮手动干的时候,无意间发现,通义的翻译功能,竟然能完美解决我的问题。
不仅免费,且整体体验非常好,于是有了这篇文章,分享给大家。
这个功能在哪?怎么用?
本文中,主要介绍在电脑上的使用方法,因为处理文档和截图,还是电脑效率更高。
首先,在浏览器打开「通义」的官方网站,可以戳这里访问:https://www.tongyi.com/
进来之后,在中间的输入框,能看到一个「翻译」按钮,点击。
接下来,只需要将目标图片或者文档上传给它即可。
整个界面非常清爽,一目了然。
当然,它也有手机App,操作逻辑是类似的,而且手机上功能会更多一些,大家可以按需选择。
沉浸式翻译
生活中,总免不了会遇到一些「看得懂字,但看不懂意思」的时刻。
比如,朋友从日本寄来了一包零食,包装背后的成分表写得密密麻麻;海淘了一个小家电,说明书却是意大利语,仿佛天书;又或者,你只是想看懂一张韩语的购物清单。
这些场景非常高频,但又不足以让我们专门去学习一门语言。
这时候,通义的「图片翻译」就派上用场了。
你只需要对着那段文字拍个照,它就能直接在原图上,把外文替换成中文。
最关键的是,它不止是对原文进行翻译,重点还会还原排版、字体和背景。
这种「沉浸式」的体验感真的非常棒,翻译结果就像是产品自带的官方中文版一样,自然又直观。
而且,除了常见的中英日韩,它居然支持几十种语言的互译。
这个能力,对于有小语种翻译需求的朋友来说,绝对是神器。
长文档翻译
说回我开头提到的那个核心痛点——翻译一份图文并茂的 PDF 文档。
用传统的网页翻译,出来的结果往往是车祸现场,格式全乱,图片和文字对不上号,校对和重新排版的时间,比看懂内容本身花得还要多。
而通义的「文档翻译」功能,使用起来非常简单,直接把你的源文档扔进去,选择目标语言,稍等片刻,它就会生成一份翻译好的新文档。
点击查看文档,即能看到完整内容,左边是源文档,右边是翻译完成的成果。
左上角还有导读、翻译、脑图、笔记等不同的功能。
点击脑图按钮,就能看到对整个文档的思维导图形式的总结,而且是使用目标语言。
如果对于文档有不理解的地方,还可以在下方输出框,发送具体的问题。
通义就会基于文档内容进行回答。
点击翻译按钮,打开翻译后的文档,你会发现,里面的排版、字体、公式、表格、甚至是图片位置,几乎都原封不动地保留了下来。
文字被精准地替换成了中文,但整个文档的骨架和灵魂都还在。
整个过程大概也就一分钟的时间,不仅完成得快,而且完成度也很高。
预览无误之后,点击右上角即可一键导出下载,还能自由选择多种格式。
导出到本地,打开源文件可以看到,还原图基本在 90% 以上,大部分场景下完全可以直接使用。
对于学生党看外文文献,职场人读行业报告来说,这个功能的核心价值,已经不是「翻译」了,而是「解放生产力」。
写在最后
体验下来,我觉得通义的翻译功能,非常实用,没有去堆砌一些花里胡哨、用不上的功能。
它的核心优势很明确:一是尽可能地还原排版,保留原汁原味的阅读体验;二是支持足够多的语言,覆盖我们可能遇到的大多数情况。
如果你也有需要跨语言处理图片或文档的需求,真心建议你也去试试。
希望今天的分享,对你有用。
我是艾康,会持续分享AI时代下的思考方式,如果想第一时间收到推送,欢迎关注公众号,并设为星标⭐。
扫描下方二维码,备注「公众号」,免费送你一份《AI编程与智能体从 0 到 1完整手册》。
如果觉得这篇文章有用的话,感谢点赞、在看➕关注👆,我是艾康,咱们下篇见!
没有评论:
发表评论