当前位置: 首页 > news >正文

建设教育网站seo技术好的培训机构

建设教育网站,seo技术好的培训机构,wordpress上传直连播放,用备案的网站做违法网站文章目录数据文件准备wav.scputt2spkspk2utttext相关代码根据文件生成 utt2spk 和 wav.scputt2spk -- spk2utt 转换数据文件准备 在训练/解码中: 有三个文件是必要的: wav.scp 语音编号 – 路径信息utt2spk 语音编号 – 说话人编号spk2utt 说话人编号 …

文章目录

    • 数据文件准备
      • wav.scp
      • utt2spk
      • spk2utt
      • text
    • 相关代码
      • 根据文件生成 utt2spk 和 wav.scp
      • utt2spk -- spk2utt 转换


数据文件准备

在训练/解码中:
有三个文件是必要的:

  1. wav.scp 语音编号 – 路径信息
  2. utt2spk 语音编号 – 说话人编号
  3. spk2utt 说话人编号 – 说话人的语音编号;可以根据 spk2utt 生成,下面将会介绍

一个标注文件用于测试的:
text


这里以 aishell 为例:

wav.scp

结构

[utterance] [wav_path]

BAC009S0002W0122 /home/code/kaldi/egs/aishell/s5/data1/data_aishell/wav/train/S0002/BAC009S0002W0122.wav
BAC009S0002W0123 /home/code/kaldi/egs/aishell/s5/data1/data_aishell/wav/train/S0002/BAC009S0002W0123.wav
BAC009S0002W0124 /home/code/kaldi/egs/aishell/s5/data1/data_aishell/wav/train/S0002/BAC009S0002W0124.wav

utt2spk

结构:

[utterance] [speaker]

BAC009S0002W0122 S0002
BAC009S0002W0123 S0002

spk2utt

结构:

[speaker] [utterance]

S0002 BAC009S0002W0122 BAC009S0002W0123 BAC009S0002W0124 BAC009S0002W0125 BAC009S0002W0126 BAC009S0002W0127 BAC009S0002W0128 BAC009S0002W0129 BAC009S0002W0130 BAC009S0002W0131 BAC009S0002W0132 ...
S0003 BAC009S0003W0121 BAC009S0003W0122 BAC009S0003W0123 BAC009S0003W0124 BAC009S0003W0125 BAC009S0003W0126 BAC009S0003W0127 BAC009S0003W0128 BAC009S0003W0129 BAC009S0003W0130 BAC009S0003W0131  ...
S0004 BAC009S0004W0121 BAC009S0004W0123 BAC009S0004W0124 BAC009S0004W0125 BAC009S0004W0126 BAC009S0004W0127 BAC009S0004W0128 ...

text

[utterance] [transcript]

BAC009S0002W0122 而 对 楼市 成交 抑制 作用 最 大 的 限 购
BAC009S0002W0123 也 成为 地方 政府 的 眼中 钉
BAC009S0002W0124 自 六月 底 呼和浩特 市 率先 宣布 取消 限 购 后
BAC009S0002W0125 各地 政府 便 纷纷 跟进
BAC009S0002W0126 仅 一 个 多 月 的 时间 里

相关代码

根据文件生成 utt2spk 和 wav.scp

假设文件按 说话人–音频 排列,可以使用下属代码生成 utt2spk 和 wav.scp 文件

import osdata_root_dir = 'data'
utt2spk_path = 'utt2spk'
wav_scp_path = 'wav.scp'for speaker in os.listdir(data_root_dir):if speaker.startswith('.'):continuespearker_dir = os.path.join(data_root_dir, speaker)for wav in os.listdir(spearker_dir):if wav.startswith('.'):continuewav_path = os.path.join(spearker_dir, wav)wav_id = f'{speaker}_{wav}' with open(wav_scp_path, 'a') as fa:fa.write(wav_id + ' ' + wav_path + '\n')with open(utt2spk_path, 'a') as fa:fa.write(wav_id + ' ' + speaker + '\n') 

utt2spk – spk2utt 转换


你可以使用代码 将 utt2spk 转为 文件:

kaldi_root/egs/wsj/s5/utils/utt2spk_to_spk2utt.pl  utt2spk > spk2utt

utt2spk 文件内不能有空行,否则可能报错


同样,你也可以使用 spk2utt_to_utt2spk.pl 反向将 spk2utt 生成 utt2spk


伊织 2023-02-09 (四,晴)

http://www.dt0577.cn/news/46996.html

相关文章:

  • p2p网站开发用什么平台深圳网站建设微信开发
  • 网站生成pc应用如何seo推广
  • 杭州响应式网站长春网站优化团队
  • 南通市建设局网站南宁seo优化公司
  • 天津酒店网站制作化工seo顾问
  • 东莞市网络营销推广怎么样seo建设招商
  • 东莞做网站找微客巴巴网站收录大全
  • 网站建设运营要求企业邮箱注册
  • 深圳工信部网站备案信息查询百度app营销软件
  • 云南做网站哪家便宜在线发外链工具
  • 网站放假通知免费网站建设
  • 如何让别人看到自己做的网站微信小程序开发教程
  • 淘宝网站那个做的app推广方案范例
  • 贵阳网站制作cncolour手机做网页的软件
  • 用群晖做网站服务器长春seo招聘
  • 网站开发工程师 课程大纲网站优化推广培训
  • 网站维护需要网络营销的优缺点
  • 做印刷去哪个网站找工作深圳网络推广外包
  • wordpress主题图片替换班级优化大师使用指南
  • wordpress db host网站优化排名金苹果系统
  • 西安网站建设公司有哪些品牌营销案例分析
  • 英文seo网站建设娃哈哈软文推广
  • 企业网站建设的目的有()网上竞价平台
  • 南阳专业做网站小程序开发教程全集免费
  • 轴承外贸平台哪个网站最好关于网络推广的方法
  • 企业网站一般多少钱seo网站关键词优化报价
  • 企鹅号自媒体平台注册优化大师下载
  • 强网站日常监测及内容建设北京百度关键词优化
  • 建设银行商城网站seo怎么推广
  • 个人外贸公司网站产品推广找哪家公司