标签搜索

目 录CONTENT

文章目录

工作进展

小小城
2021-11-18 / 0 评论 / 0 点赞 / 11 阅读 / 1,842 字 / 正在检测是否收录...
温馨提示:
本文最后更新于 2022-05-02,若内容或图片失效,请留言反馈。部分素材来自网络,若不小心影响到您的利益,请联系我们删除。

主要工作需求/进展

[toc]

2022-03-01~2022-04-01

  1. 离线个性化融合版本5.1.0版本开发完成
  2. 搭建可以回归历史音库、技术的demo
  3. 修复多实例crash

2022-02-01~2022-03-01

  1. 离线引擎前端tn模块完成规则裁剪,集成tn模型,开发完成。串通pylib提交给算法同学进行评测。基于离线裁剪后的v5分支,完成相关自测,完善android,ios,以及嵌入式编译链

2022-01-01~2022-02-01

  1. 提测AI开放平台V3升级V4,解决QA测出的问题导致前端注音不准确的问题
  2. 提供多实例、ccic3的引擎库
  3. 熟悉离线引擎前端模块,将tn模型集成到离线前端

2021-12-01~2022-01-01

  1. 将tac + subgan支持打包成一个资源逻辑(1. 如果外部dat未设置spkid,styid,在合成单句时就不设置spkid,styid,反正需要设置)
  2. 发送top10000书籍时新增一个书籍类型字段,同3一起
  3. 将本次发送的top10000所有书的新增字段 频道_一级类目_二级类目 写到文件,存放到指定目录下统一发送
  4. 将性别、年龄模型未预测出来的手动添加一个默认值(性别为male;年龄为age_young)
  5. 离线引擎支持多实例

2021-11-01~2021-12-01

  1. 解决21磁盘空间不足问题,实现多个盘并存的问题
  2. 测试词典笔v3和v4的性能
  3. 开发解决csubgan音量较小的问题
  4. 开发ios、鸿蒙编译链」
  5. 性别年龄预测脚本串通
  6. 解决平台发送请求字段丢失bug
  7. 词典笔前端性能具体分析
  8. 离线TTS引擎4.9.0 AI开放平台纯英文需求(背景:开放平台离线引擎V3支持text资源和speech资源是纯英文的场景,可以完成纯英文合成,但离线引擎V4不支持text资源和speech资源是纯英文的场景,原因是无法正常初始化离线引擎,依赖中文...; 方案: 1. 使用中英混的text和speech资源,让离线引擎只合成英文,跳过中文。 步骤: 1.打包speech资源时在头部增加一个字段,主要用来标记当前speech音库是一个特殊的音库:纯英文合成;2. 在离线引擎根据音库当中的字段修改TTS_PARAM_BILINGUAL_TEXT_ENGLISH_MODE = 2,保证用户使用方式不变)

2021-10-01~2021-11-01

  1. 协助排查csubgan问题
  2. 搭建通用嵌入式编译链
  3. 小说资源生产自动化自测
  4. 协助排查csubgan效果问题,提测csubgan
  5. 排查csubgan因为stop引擎返回错误问题以及进度跳变问题

2021-09-01~2021-10-01

  1. 小说训练服务bug问题
    a899c89f0e7b2a82a4e4f0e6a853bb79.png
  2. 离线引擎4.7.0完善代码,增加spec调整系数到配置当中
  3. 离线引擎4.7.0提测前内存检查、回归自测
  4. 离线引擎提测4.7.0
  5. 熟悉将Mac上的音库推到安卓手机上合成音频,再拉回来听效果
  6. 完善离线引擎代码,提测确定max/min_phone_thords
  7. 熟悉subgan模块代码
  8. 配合进行车联网模型压缩测试phone分片的阀值
  9. 排查 压测Meitron模型压缩版本离线合成随机切换发音人case,12小时出现56次报错-111 offline engine synthesize result not 0,的case,结论是该case是正常现象
  10. 根据提供的c_subgan相关新的houyi_score编一个安卓armv7a的bin,进行后期的性能测试
  11. 排查影响小说生产的bug,v3状态等
  12. 完成自动化、加速相关开发,准备测试
  13. 小说拉取资源方式改变

2021-08-01~2021-09-01

  1. 熟悉离线引擎tts-lyre模块代码
  2. 熟悉小说训练服务代码,串通小说训练自动化需求,确定开发方案
  3. 熟悉小说训练服务的平台侧代码
  4. 离线TTS引擎个性化模型压缩-车联网
    • 组织开发引擎代码
    • inference 阶段在声学模型后增加后处理模块调整uv阀值。
    • 在后羿打分库的回调函数处根据中间结果prosody scale确定phone的帧数,并且增加最大帧、最小帧对phone帧数的判断
    • 完善引擎4.7.0整个链路打通
    • 模型压缩效果对齐
    • 将sp_max_ms 和 tail_sil_max_ms调整到配置当中
  5. 小说训练服务搭建测试环境

2021-07-07~2021-08-01

  1. 熟悉离线引擎代码
  2. 熟悉小说训练服务
  3. 解决词典笔 don't 发音为do not的类的badcase问题
  4. 解决词典笔 friends' 形式的发音问题
  5. 建立打包纯英文文本资源流水线
  6. 小说训练服资源池模块多进程完成小说的下载切分、入池提速,提速约10倍
0

评论区