通过 百d语音转文本 接口实现,可以目前只写了mp4和b站视频转成文本,需要其他格式的可以自己修改
测试了40多分钟的视频也是可以转换的(自行测试),识别率还是很ok的,至于转换速度的话,可以自己写成多线程,速度会快一些
百d接口自己申请一个,一个账号可以免费15w次,下载后替换成自己的 APIKEY和SecretKey