# API_work
**Repository Path**: timem00n/API_work
## Basic Information
- **Project Name**: API_work
- **Description**: No description available
- **Primary Language**: Unknown
- **License**: Not specified
- **Default Branch**: master
- **Homepage**: None
- **GVP Project**: No
## Statistics
- **Stars**: 0
- **Forks**: 0
- **Created**: 2020-06-19
- **Last Updated**: 2020-12-19
## Categories & Tags
**Categories**: Uncategorized
**Tags**: None
## README
文档名称 | 知情——产品需求文档
---|---
产品名称 | 知情
产品描述 | 一款利用语音识别用户情绪的轻小型APP
产品版本 | 2.0
文件现状 | 进行中
文件作者 | 童鼎
# 增量改进
* 增加ESG问题描述
* 添加额外URL
* 添加IDEO表格
* 修改部分描述
# 加值宣言
目前市场上,并没有专门分析语音情感的APP出现,知情APP很好地弥补了该项应用的空白。知情APP使用语音识别API与情感分析API,对用户的语音进行情绪识别,这两项API很好地解决了情绪分析这一问题
# 一、需求概述
### 1.产品背景
随着网络社交软件的发展,已经有一部分人习惯于使用**语音**在社交软件上进行交流互动。而语音相比于文字,更能体现出自身的情绪与状态。**这款软件能很好地分析对方的情绪倾向,并进行建议。**
### 2.产品市场
由于该类型的APP在市场上并没有先例,尤其是对语音进行分析的APP少之又少,因此该应用的市场需要自行探索。目前,与本产品最为类似的应用,是作为插件安装在各FM以及配音平台上的音色分析应用
### 3.市场概述
1.语音识别市场概述
从目前的来看,中国两大社交平台——微信、QQ上都有自带的语音识别插件,将**普通话**转化为**文字**,简单地将改API作为插件附在了APP上。而相似的音色分析则作用于[配音秀](http://www.peiyinxiu.com/)、[麦萌](http://www.meng2u.com/)等音频为主题的APP上。但是两种应用于本产品都有些许差异。
2.市场特征
* 市场空白,目前该应用并没有大型的相似产品,不用担心竞争。
* 可以完善以音频为主打项目APP缺少的功能
# 二、核心价值
主要用于解决语音体现的情绪倾向问题
**用户痛点:**
* 音频平台需要分析音频的质量与情绪
* 好友聊天时不知对心情究竟如何
# 三、用户分析
1.目标用户群
* 15~25岁,常聊天者多数使用语音的群体
2.用户画像及使用场景
| 序号 |姓名 | 性别 |年龄阶段 | 职业
|---|---|---|---|---
|①| 李阳 | 男 | 16岁 | 学生 |
|②| 何紫欣 |女 | 25岁 |[配音实习生](http://www.tyssgzs.com/?source=baidu&plan=%E3%80%90%E6%96%B0%E3%80%91%E5%8A%A8%E6%BC%AB%E9%85%8D%E9%9F%B3&unit=%E5%8A%A8%E7%94%BB%E9%85%8D%E9%9F%B3&keyword=%E9%85%8D%E9%9F%B3%E5%B7%A5%E4%BD%9C%E5%AE%A4&e_matchtype=1&e_creative=37761003616&e_adposition=cl2&e_pagenum=1&e_keywordid=148563641116&e_keywordid2=148563641116#page1&bd_vid=9092572609356365982)
* 使用场景①:李阳是一名刚上高中的学生,他在现实中不善交集,在网络中却有许多素昧谋面的网友,一天,他在网络上倾诉自己的苦闷,但是对面的网友似乎有些心不在焉,他不知道究竟是不是自己的错觉,犹豫是否还要继续讲下去。
* 使用场景②:何紫欣是一名刚毕业的,正在配音工作室实习的实习生,一个人回家后没有其他人指导,想看看的配音作品情绪是否到位,却没有其他人进行评价。
*
# 四、核心价值与用户痛点
用户痛点 | API加值
---|---
无法得知对方的情感倾向 | 情感分析API
无法探知某段语音的情绪 | 语音识别&情感分析API
# 五、需求列表(对应人工智能加值)
API技术 | 用户场景 | 优先级
---|---|---
[百度语音识别API](https://ai.baidu.com/tech/speech/asr) | 将对方的语音转化为文字 | B(次优先)
[百度情感倾向分析API](https://ai.baidu.com/tech/nlp_apply/sentiment_classify) | 分析对方的语音情绪 | A(优先级)
* 解决方案的影响
人工智能API类型 | ESG问题
---|---
语音转文本| 从社会问题来看,语音转文本可以减少用户对于不必要语音的倾听时间,增加用户的信息读取速率
情感倾向分析 | 从社会问题分析,情感倾向分析可以更好地让人与人之间的交流变得更“善解人意”。
# 六、产品结构图
# 七、产品原型及交互
1.启动界面
2.登录界面
3.核心界面,语音识别交互功能
**此页面用于提交音频**
**此页面为音频反馈界面**
# 八、API的应用
## IDEO三要素
要素 | 内容
---|---
用户可欲性 |使用情感分析对文本进行判断,满足用户对对方情绪的把握
技术可行性 | 使用百度AI中的情感分析API进行分析
商业可行性 |在分析时对用户的聊天记录进行收集记录,充实用户数据库
(一)语音识别
百度AI开放平台——语音识别(本产品使用的api平台)
* 接口描述:该请求用于将语音识别转化为文字。
* 接口地址:http://vop.baidu.com/server_api
* 请求方法:POST
(一)请求token,代码如下
(二)使用语音识别API将语音转化为文字
**由于调用次数超过限制,所以无法转换**
(三)使用情绪分析API将文字转化为文字进行分析,得出情感倾向
# 九、使用风险评估
缺陷及解决方法:
1.情感倾向无法很好地反应出具体情绪,譬如悲伤、愤怒、喜悦、无奈,需要对情感偏向做一个更具体的文字列表,并进行推测。
2.情感偏向仍然只能测出文案的情感倾向,而无法识别语气中的区别,该应用无法从根本上对语气进行识别
# 十、竞品分析
竞品| 简介 | 定位|
---|---|---
[声鉴卡](https://minapp.com/miniapp/4903/) | 将用户的音色进行分析,并判断出响应音色|以音频为主题的平台,站内布满了高质量的配音作品
[语音转文字插件](https://blog.csdn.net/qq_41638795/article/details/98080498)| QQ、微信内置的小插件,将语音条转化为相应文本 |辅助功能
# 十一、该产品的未来构想
发展理念:由基础功能延伸,逐渐完善缺陷,收集数据,进行分析。
(一)产品迭代过程
* **1.0**
1. 将语音转化为文本
2. 识别文本的情绪倾向
3. 接受用户信息反馈及用户历史信息记录
* **2.0**
1. 分析用户历史信息并将历史信息关键词与数据库做对比,分析该文本的情绪倾向
# 十二、学习/实践心得
* 本次项目实践,感谢[百度AI平台](http://ai.baidu.com/?track=cp:aipinzhuan|pf:pc|pp:AIpingtai|pu:title|ci:|kw:10005792)提供的语音识别API及百度AI平台提供的情绪倾向分析API,另外感谢“[挣扎的蓝藻](https://blog.csdn.net/qq_38161040/category_8540632.html)”,在本次代码写作方面对我提供了巨大帮助
* 总结:
随着智能手机的普及,短音频逐渐成为了较为常见的交流方式之一,伴随着这一情况,太多的情绪隐藏在声音之中,而我们无从了解感受,因此有了解决该痛点的想法。本产品对用户提供[语音识别](https://ai.baidu.com/tech/speech/asr)、[情感分析功能](https://ai.baidu.com/docs#/NLP-API/top)。希望能够帮助用户解决以上问题