# API_work **Repository Path**: timem00n/API_work ## Basic Information - **Project Name**: API_work - **Description**: No description available - **Primary Language**: Unknown - **License**: Not specified - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 0 - **Created**: 2020-06-19 - **Last Updated**: 2020-12-19 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README 文档名称 | 知情——产品需求文档 ---|--- 产品名称 | 知情 产品描述 | 一款利用语音识别用户情绪的轻小型APP 产品版本 | 2.0 文件现状 | 进行中 文件作者 | 童鼎 # 增量改进 * 增加ESG问题描述 * 添加额外URL * 添加IDEO表格 * 修改部分描述 # 加值宣言 目前市场上,并没有专门分析语音情感的APP出现,知情APP很好地弥补了该项应用的空白。知情APP使用语音识别API与情感分析API,对用户的语音进行情绪识别,这两项API很好地解决了情绪分析这一问题 # 一、需求概述 ### 1.产品背景 随着网络社交软件的发展,已经有一部分人习惯于使用**语音**在社交软件上进行交流互动。而语音相比于文字,更能体现出自身的情绪与状态。**这款软件能很好地分析对方的情绪倾向,并进行建议。** ### 2.产品市场 由于该类型的APP在市场上并没有先例,尤其是对语音进行分析的APP少之又少,因此该应用的市场需要自行探索。目前,与本产品最为类似的应用,是作为插件安装在各FM以及配音平台上的音色分析应用 ### 3.市场概述 1.语音识别市场概述
从目前的来看,中国两大社交平台——微信、QQ上都有自带的语音识别插件,将**普通话**转化为**文字**,简单地将改API作为插件附在了APP上。而相似的音色分析则作用于[配音秀](http://www.peiyinxiu.com/)、[麦萌](http://www.meng2u.com/)等音频为主题的APP上。但是两种应用于本产品都有些许差异。 2.市场特征
* 市场空白,目前该应用并没有大型的相似产品,不用担心竞争。 * 可以完善以音频为主打项目APP缺少的功能 # 二、核心价值 主要用于解决语音体现的情绪倾向问题 **用户痛点:** * 音频平台需要分析音频的质量与情绪 * 好友聊天时不知对心情究竟如何 # 三、用户分析 1.目标用户群 * 15~25岁,常聊天者多数使用语音的群体 2.用户画像及使用场景 | 序号 |姓名 | 性别 |年龄阶段 | 职业 |---|---|---|---|--- |①| 李阳 | 男 | 16岁 | 学生 | |②| 何紫欣 |女 | 25岁 |[配音实习生](http://www.tyssgzs.com/?source=baidu&plan=%E3%80%90%E6%96%B0%E3%80%91%E5%8A%A8%E6%BC%AB%E9%85%8D%E9%9F%B3&unit=%E5%8A%A8%E7%94%BB%E9%85%8D%E9%9F%B3&keyword=%E9%85%8D%E9%9F%B3%E5%B7%A5%E4%BD%9C%E5%AE%A4&e_matchtype=1&e_creative=37761003616&e_adposition=cl2&e_pagenum=1&e_keywordid=148563641116&e_keywordid2=148563641116#page1&bd_vid=9092572609356365982) * 使用场景①:李阳是一名刚上高中的学生,他在现实中不善交集,在网络中却有许多素昧谋面的网友,一天,他在网络上倾诉自己的苦闷,但是对面的网友似乎有些心不在焉,他不知道究竟是不是自己的错觉,犹豫是否还要继续讲下去。 * 使用场景②:何紫欣是一名刚毕业的,正在配音工作室实习的实习生,一个人回家后没有其他人指导,想看看的配音作品情绪是否到位,却没有其他人进行评价。 * # 四、核心价值与用户痛点 用户痛点 | API加值 ---|--- 无法得知对方的情感倾向 | 情感分析API 无法探知某段语音的情绪 | 语音识别&情感分析API # 五、需求列表(对应人工智能加值) API技术 | 用户场景 | 优先级 ---|---|--- [百度语音识别API](https://ai.baidu.com/tech/speech/asr) | 将对方的语音转化为文字 | B(次优先) [百度情感倾向分析API](https://ai.baidu.com/tech/nlp_apply/sentiment_classify) | 分析对方的语音情绪 | A(优先级) * 解决方案的影响 人工智能API类型 | ESG问题 ---|--- 语音转文本| 从社会问题来看,语音转文本可以减少用户对于不必要语音的倾听时间,增加用户的信息读取速率 情感倾向分析 | 从社会问题分析,情感倾向分析可以更好地让人与人之间的交流变得更“善解人意”。 # 六、产品结构图 # 七、产品原型及交互 1.启动界面 2.登录界面 3.核心界面,语音识别交互功能 **此页面用于提交音频** **此页面为音频反馈界面** # 八、API的应用 ## IDEO三要素 要素 | 内容 ---|--- 用户可欲性 |使用情感分析对文本进行判断,满足用户对对方情绪的把握 技术可行性 | 使用百度AI中的情感分析API进行分析 商业可行性 |在分析时对用户的聊天记录进行收集记录,充实用户数据库 (一)语音识别 百度AI开放平台——语音识别(本产品使用的api平台) * 接口描述:该请求用于将语音识别转化为文字。 * 接口地址:http://vop.baidu.com/server_api * 请求方法:POST (一)请求token,代码如下 (二)使用语音识别API将语音转化为文字 **由于调用次数超过限制,所以无法转换** (三)使用情绪分析API将文字转化为文字进行分析,得出情感倾向 # 九、使用风险评估 缺陷及解决方法: 1.情感倾向无法很好地反应出具体情绪,譬如悲伤、愤怒、喜悦、无奈,需要对情感偏向做一个更具体的文字列表,并进行推测。 2.情感偏向仍然只能测出文案的情感倾向,而无法识别语气中的区别,该应用无法从根本上对语气进行识别 # 十、竞品分析 竞品| 简介 | 定位| ---|---|--- [声鉴卡](https://minapp.com/miniapp/4903/) | 将用户的音色进行分析,并判断出响应音色|以音频为主题的平台,站内布满了高质量的配音作品 [语音转文字插件](https://blog.csdn.net/qq_41638795/article/details/98080498)| QQ、微信内置的小插件,将语音条转化为相应文本 |辅助功能 # 十一、该产品的未来构想 发展理念:由基础功能延伸,逐渐完善缺陷,收集数据,进行分析。 (一)产品迭代过程 * **1.0** 1. 将语音转化为文本 2. 识别文本的情绪倾向 3. 接受用户信息反馈及用户历史信息记录 * **2.0** 1. 分析用户历史信息并将历史信息关键词与数据库做对比,分析该文本的情绪倾向 # 十二、学习/实践心得 * 本次项目实践,感谢[百度AI平台](http://ai.baidu.com/?track=cp:aipinzhuan|pf:pc|pp:AIpingtai|pu:title|ci:|kw:10005792)提供的语音识别API及百度AI平台提供的情绪倾向分析API,另外感谢“[挣扎的蓝藻](https://blog.csdn.net/qq_38161040/category_8540632.html)”,在本次代码写作方面对我提供了巨大帮助 * 总结: 随着智能手机的普及,短音频逐渐成为了较为常见的交流方式之一,伴随着这一情况,太多的情绪隐藏在声音之中,而我们无从了解感受,因此有了解决该痛点的想法。本产品对用户提供[语音识别](https://ai.baidu.com/tech/speech/asr)、[情感分析功能](https://ai.baidu.com/docs#/NLP-API/top)。希望能够帮助用户解决以上问题