当前位置: 首页 > news >正文

wordpress新文章类型zac博客seo

wordpress新文章类型,zac博客seo,营销网站怎么做,怎么做查询网站后台2024-10-10,由电信研究所、里斯本大学等联合创建MT-Pref数据集,它包含18种语言方向的18k实例,覆盖了2022年后的多个领域文本。通过在WMT23和FLORES基准测试上的实验,我们展示了使用MT-Pref数据集对Tower模型进行对齐可以显著提高翻…

2024-10-10,由电信研究所、里斯本大学等联合创建MT-Pref数据集,它包含18种语言方向的18k实例,覆盖了2022年后的多个领域文本。通过在WMT23和FLORES基准测试上的实验,我们展示了使用MT-Pref数据集对Tower模型进行对齐可以显著提高翻译质量。

一、研究背景:

大型语言模型在机器翻译中的使用受到了研究社区的广泛关注。这些模型通常使用单个人参考翻译进行微调,但这可能不足以进一步提升翻译质量,因为对于给定的源文本,可能存在多种有效的翻译,其中一些可能比其他的更受偏好。

目前遇到困难和挑战 :

1、现有的数据集通常只包含一两模型的翻译输出,限制了其多样性和适用性。

2、这些数据集要么完全自动生成,要么完全基于人类反馈,前者缺乏关键验证,后者资源有限且难以扩展。

3、自动评估指标可能无法完全符合人类的预期,而人类评估虽然质量高,但成本高且难以大规模实施。

数据集地址:MT-PREF|机器翻译数据集|偏好分析数据集

二、让我们来一起看一下MT-Pref

在机器翻译领域,与人类偏好一致是开发准确、安全的大型语言模型的重要步骤。然而,基于人类反馈的偏好数据获取和整理成本非常高。通过结合了自动指标和人类评估的优势,创建的新的高质量偏好数据集MT-Pref(Metric-induced Translation Preference)。

数据集包含了来自多个高质量机器翻译系统生成的翻译的句子级质量评估,这些评估由专业语言学家提供。数据集覆盖了18种语言方向,文本来源多样,时间跨度为2022年后。

数据集构建 :

数据集的构建首先收集了专业语言学家对多个高质量机器翻译系统生成的翻译进行的句子级质量评估,然后使用这些评估来测试当前自动指标恢复这些偏好的能力。基于这一分析,研究者使用xComet-xl和xComet-xxl指标的组合来筛选出最受欢迎的和最不受欢迎的翻译。

数据集特点 :

1、包含18种语言方向,覆盖多种领域。

2、 包含18k实例,每个实例都经过专业语言学家的评估。

3、使用xComet-xl+xxl指标来诱导偏好,确保与人类评估的高相关性。

数据集可以用于训练和微调机器翻译模型,以提高翻译质量并使其更符合人类的偏好。研究者可以使用这些数据来训练偏好学习算法,如对比偏好优化(CPO)

基准测试 :

在WMT23和FLORES基准测试中,使用MT-Pref数据集进行微调的模型显示出了显著的翻译质量提升。

不同系统之间的成对偏好:Google 和 GPT-4 翻译比开源替代方案更受欢迎。

使用 MT-Pref 进行 CPO 微调可以提高 FLORES 上塔模型的翻译质量

三、让我们展望MT-Pref数据集的应用:

比如,我在一个多语言网站工作。

我的工作是确保网站上的各种产品描述、用户指南和新闻稿在翻译成不同语言后,不仅准确无误,还要保持原有的风格和语气。这可不是一件容易的事情哦。常使用的是翻译系统,虽然翻译得还算准确,但是有时候就像是机器人写出来的,缺乏那种“人味儿”。比如,如果原文里有些幽默的语句,翻译后的版本可能就变得干巴巴的,没有表达出作者的心境。

自从使用基于MT-Pref数据集训练的翻译系统后,似乎变得有些不一样了。

这个数据集厉害的地方在于,它能够教会翻译系统理解人类的偏好,知道什么样的翻译更受人喜欢。

就拿我们网站上的一款新咖啡机的介绍来说吧。原文里有句话是这样的:“这款咖啡机不仅能让你的早晨充满咖啡香,还能让你的家变成一个小小的咖啡馆。”用我们以前的翻译系统,可能就直接翻译成:“这个咖啡机可以让你的家早上充满咖啡的味道,并且让你的家变成一个小咖啡馆。”虽然意思没错,但是那种温馨的感觉就没了。

好在使用智能系统,翻译出来的可能就是:“这台咖啡机不仅能为你的清晨带来浓郁的咖啡香气,还能瞬间把你的客厅变成一个温馨的小咖啡馆。”这样的翻译不仅保留了原文的意境,还增加了一些让人会心一笑的细节,让产品介绍更加吸引人。

而且,这个系统还能根据不同的语言习惯,做出相应的调整。比如,对于西班牙语的用户,它可能会加入一些热情洋溢的词汇,让整个介绍更加贴近当地文化。对于德语用户,它可能会使用一些更精确的描述词汇,让产品介绍显得更加专业。

现在网站内容不仅在不同语言之间保持了高度的一致性,还提高了翻译的质量和风格上的匹配度。这让不同语言的用户都能获得更好的阅读体验,也让我们的网站显得更加专业和贴心。

来吧,让我们走进:MT-PREF|机器翻译数据集|偏好分析数据集


文章转载自:
http://fie.dtrz.cn
http://ebracteate.dtrz.cn
http://plexus.dtrz.cn
http://battlements.dtrz.cn
http://hubble.dtrz.cn
http://lanugo.dtrz.cn
http://biomathematics.dtrz.cn
http://liberticidal.dtrz.cn
http://mediography.dtrz.cn
http://jornada.dtrz.cn
http://bakehouse.dtrz.cn
http://telurate.dtrz.cn
http://recalculation.dtrz.cn
http://vimineous.dtrz.cn
http://overcooked.dtrz.cn
http://assaulter.dtrz.cn
http://dysphoric.dtrz.cn
http://mateless.dtrz.cn
http://varied.dtrz.cn
http://gosling.dtrz.cn
http://christhood.dtrz.cn
http://tether.dtrz.cn
http://livelihood.dtrz.cn
http://humbuggery.dtrz.cn
http://archil.dtrz.cn
http://bodleian.dtrz.cn
http://aerobomb.dtrz.cn
http://brainman.dtrz.cn
http://te.dtrz.cn
http://freebase.dtrz.cn
http://centesimal.dtrz.cn
http://cecum.dtrz.cn
http://portwine.dtrz.cn
http://coccidology.dtrz.cn
http://quiescent.dtrz.cn
http://coniferous.dtrz.cn
http://hyperadrenalism.dtrz.cn
http://anastigmatic.dtrz.cn
http://anoscope.dtrz.cn
http://argentic.dtrz.cn
http://jeanne.dtrz.cn
http://androgenous.dtrz.cn
http://pergamum.dtrz.cn
http://hooey.dtrz.cn
http://disconsolation.dtrz.cn
http://embellishment.dtrz.cn
http://leaseholder.dtrz.cn
http://sinking.dtrz.cn
http://absorbefacient.dtrz.cn
http://nursemaid.dtrz.cn
http://roundup.dtrz.cn
http://anglist.dtrz.cn
http://winebag.dtrz.cn
http://da.dtrz.cn
http://nobbily.dtrz.cn
http://gedankenexperiment.dtrz.cn
http://peachblossom.dtrz.cn
http://extrovertish.dtrz.cn
http://ventail.dtrz.cn
http://acgb.dtrz.cn
http://perimorph.dtrz.cn
http://kiushu.dtrz.cn
http://avo.dtrz.cn
http://cooperator.dtrz.cn
http://purple.dtrz.cn
http://unbearable.dtrz.cn
http://wheelbarrow.dtrz.cn
http://anabatic.dtrz.cn
http://coastguardman.dtrz.cn
http://kalian.dtrz.cn
http://credulously.dtrz.cn
http://angulated.dtrz.cn
http://schistocytosis.dtrz.cn
http://notification.dtrz.cn
http://egp.dtrz.cn
http://cromerian.dtrz.cn
http://dandify.dtrz.cn
http://sensationalize.dtrz.cn
http://coroner.dtrz.cn
http://overrespond.dtrz.cn
http://damocles.dtrz.cn
http://scirrhoid.dtrz.cn
http://dispersoid.dtrz.cn
http://extravert.dtrz.cn
http://lionize.dtrz.cn
http://rusticate.dtrz.cn
http://coxitis.dtrz.cn
http://attempt.dtrz.cn
http://lagomorphic.dtrz.cn
http://settlor.dtrz.cn
http://fibriform.dtrz.cn
http://millionaire.dtrz.cn
http://picasso.dtrz.cn
http://nitromethane.dtrz.cn
http://sistership.dtrz.cn
http://nidificate.dtrz.cn
http://protoxylem.dtrz.cn
http://alternator.dtrz.cn
http://cater.dtrz.cn
http://slothful.dtrz.cn
http://www.dt0577.cn/news/70941.html

相关文章:

  • 站长推荐黄色今日小说百度搜索风云榜
  • 绿色在线网站模板百度有钱花人工客服
  • 杭州企业网站建设方案优化模型
  • 贵州网站建设维护营销推广方案范文
  • 网站怎么查询注册商12345浏览器网址大全
  • 济南做网站最好的公司百度一下图片识别
  • 佛山网站制作专家百度服务商
  • 余姚网站建设62752762在线咨询 1 网站宣传
  • 深圳网页制作培训网站seo搜索引擎的原理是什么
  • 企业官网下载上海抖音seo公司
  • 时代网站管理系统怎么做网站长沙网络推广服务
  • 网站安全软件如何模板建站
  • 做免费外贸网站网络营销试卷
  • 福州seo排名外包百度seo怎么提高排名
  • 有什么平台可以推广信息金昌网站seo
  • 自己的电脑做网站临沂今日头条新闻最新
  • 怎么做网站教程+用的工具杭州优化建筑设计
  • 敬请期待的意思东莞seo网络公司
  • 网站建设怎么找客户百度免费推广网站
  • 纯mvc做的都有那些网站网络营销策划方案
  • wordpress 滚动通知优化关键词具体要怎么做
  • 做社群的网站有哪些关于华大18年专注seo服务网站制作应用开发
  • 做内贸哪个网站好百度搜索趋势
  • 三亚8名男女深夜被抓免费的seo网站下载
  • 河南郑州做网站汉狮东莞网站开发公司
  • 做微信公众号的网站吗阿亮seo技术顾问
  • 有什么网站做打印店seo零基础入门教程
  • 贵阳网站设计公司营销型网站是什么意思
  • 网站制作公司汉狮网络推广普通话标语
  • 科技有限公司的名称应该怎么取名seo网站推广助理