# api **Repository Path**: angelakn/api ## Basic Information - **Project Name**: api - **Description**: No description available - **Primary Language**: Unknown - **License**: Not specified - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 0 - **Created**: 2020-06-30 - **Last Updated**: 2020-12-19 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # Psearch产品需求文档 * 产品名称:Psearch * 产品描述:一款用来搜索图片的APP,用户可以在自建的图库或本地图库中识别并搜索相同的图片,或用来寻找网络图片的原图 | 产品名称 | Psearch | | ---- | ---- | | 发布日期 | 2020-07-24 | | 产品现状 |更新中 | | 产品版本 |2.1 | | 产品主人 |麦安琪 | --- ## 文档内容快捷跳转(点击下方链接即可跳转) - [价值主张宣言、核心价值](#价值主张宣言) - [用户画像、旅程地图、用户痛点](#用户痛点宣言) - [人工智能概率性考量](#人工智能概率性) - [需求列表展示及利害关系分析](#需求列表) - [界面数据流程及关键智能API使用IDEO(用户可欲性、技术可行性、商业可行性)](#产品原型) - [智能API使用的代码及数据流程展示](#API的运用) - [智能API人工智能概率性考量](#使用风险及处理办法) - [心得总结及感谢](#心得总结及感谢) - [迭代增量说明](#迭代增量说明) 共使用有效外连URL:18个。 --- ### 价值主张宣言 我认为目前市场上还没有完善的搜图工具,大多是基于某个搜索引擎的在线搜索,对于图片同时进行识别、搜索和整理的应用程序还比较少,在线搜索结果受其他广告信息干扰明显。Psearch APP就是针对现在已有的搜图APP和网站在线搜索图片进行整合和加值优化。其中Psearch APP使用到的人工智能技术有相同图片搜索、相似图片搜索和通用物体和场景识别。 **结合人工智能概率性考量,这些技术的综合运用能整合相似的搜索功能,更好地解决用户搜索图片的需求要到不同的平台完成,步骤繁琐的痛点。其带来的小概率负面影响不会压过正面影响。** ### 核心价值(最小可行性产品): 本产品的核心价值是对已有的API技术整合运用,帮助用户高效的解决当下搜索功能分散、操作繁琐的问题,功能整合后可以获得更多用户输入的图片数据,机器学习不断优化输出结果,为用户提高图片搜索准确率。 --- ### 用户痛点宣言 * 随着现代技术不断发展,数据大爆发,人们接收到的图片信息比以往都要频繁且复杂,与此同时,人们在处理这些信息的时候常常会遇到图片重复冗杂、内容不认识、模糊不清、来源不明的问题,如果要解决这些问题,用户要到不同的网站和应用程序实现,操作繁琐。这些就是目标用户的痛点。 * 用户画像及使用场景 ![输入图片说明](https://images.gitee.com/uploads/images/2020/0724/144836_fe758faa_2228567.jpeg "用户画像.jpg") * 用户旅程地图 在旅程地图中从接触点和痛点出发可以清楚的找到该产品的核心加值方向 ![输入图片说明](https://images.gitee.com/uploads/images/2020/0724/174226_defee92f_2228567.jpeg "用户旅程地图.jpg") 用户痛点|API加值 ---- | ---- 相册图片重复冗杂|百度智能平台中的相同图片搜索和相似图片搜索API 图片内容不认识|百度智能平台中的通用物体和场景识别API 图片模糊不清、来源不明|百度智能平台中的相同图片搜索API 搜索图片功能和识别图片功能常常不在一个平台|百度智能平台中的三种API综合运用 * 针对此,本产品使用图像搜索API加值中的相同图片搜索功能旨在解决用户图库照片重复占取手机内存的困扰。相似图片搜索功能可以为用户在相似的照片中选取最优的一张,或将相似的系列图片挑出来归档整理。本产品还使用了图像识别API,目的是解决用户保存图片来源不明、内容不认识的痛点。这些API组合使用为搜索图片APP加值,对应到搜索平台分散用户步骤繁琐的痛点。 --- ### 人工智能概率性 1. **百度AI图像搜索功能** : * 服务稳定:提供企业级稳定、精确的大流量服务,弹性灵活的高并发承载及99.9%以上的可靠性保障 * 亿级图库极速响应:自建图库支持亿级图片量上传入库,实现实时检索,单图毫秒级响应 据此,该产品的图片搜索准确率有保障,能够处理大量的图片数据,提供精确稳定的服务,可以减少用户在使用过程中等待响应时间过长,调用次数过多应用闪退,体验感不好等现象,对用户的负面影响不会过大。 2. **百度AI图像识别功能** : * 识别场景灵活丰富 :支持多种垂类业务场景的细粒度图像识别,精准识别超过十万种物体和场景,基于百度海量数据,持续丰富接口返回内容信息 * 支持获取百科信息:支持识别结果中返回百度百科的内容,让客户业务功能更完善、内容更丰富 在这些功能中,用户可以得到图片识别的准确而详细的信息,同时也可能存在小概率状况影响用户的体验感,例如图片识别的关键词是多义词,返回百度百科的内容有偏差。这些事件可以通过技术的改进得到缓解,对用户体验的负面影响不会压过正面影响的机率。 --- ### 需求列表 序号| 使用api | 用户场景| 优先级 ---- | ---- | ---- | ---- 01 |相同图像搜索API | 用户快速找到原图或相册相同照片 | A重要 02 |通用物体和场景识别API | 用户识别照片内容 | A重要 03 |相似图像搜索API | 用户挑选相似的照片整理相册 | B次重要 * 利害关系分析 1. 关键API人工智能类型:图像识别、图像搜索 * 对解决方案的可能关键影响:API的搜索结果可能受其他网络信息干扰准确率受影响,用户使用过程中可能有问题。 2. 利害相关者:使用APP的用户、图片原作者 * 对解决方案的可能关键影响:该APP可以帮助用户减少图片搜索整理的繁琐流程,另外也利于图片的原作者获得更多的曝光度,保障原作者/原平台的权益 3. ESG考量:用户的隐私安全是使用该app的最大隐患 * 对解决方案的可能关键影响:用户在使用过程中可能会产生大量无用重复的数据,导致服务器响应较慢,同时APP在收集这些数据的时候可能会有信息泄露的风险。 --- ### 产品原型 * **交互及界面设计** :在相册整理和搜索图片交互环节上使用了百度的AI加值,调用API获取搜索结果 ![输入图片说明](https://images.gitee.com/uploads/images/2020/0713/172943_941fa5b3_2228567.png "Psearch.png") ![输入图片说明](https://images.gitee.com/uploads/images/2020/0713/172957_01f15103_2228567.png "Psearch2.png") * **用户可欲性** :该APP使用到的api技术符合用户精确简单的检索图片的需求,界面流程清晰友好,主要功能直接展示在首页,为用户去掉繁琐的搜索步骤。 * **技术可行性** :后台申请使用本地图库和网络网络图库,确定搜索范围之后调用图像搜索api和图像识别api,用户可快速准确地查找到目标图片信息。 * **商业可行性** :近年来,随着现代技术的发展和完善,人们接收到的图片信息比以往都要频繁且复杂,图片信息增长导致用户需求明显,从目前来看,目标用户群体广泛,人工智能产品成为大众生活所需。市场同类产品较多,未来需求趋势在逐步增长。 用户可以在首页中获取图片搜索和图片识别的服务。通过检索本地图库,调用API得到相同或相似的图片,对相册进行管理。还可以提交图片,在网络图库中检索到该图片的更多资源和信息,满足用户想要图片搜索功能整合的需求。 * **数据流程图** :Psearch 数据流程核心在用户输入图片后,后台调用百度图像搜索和图像识别API,输出搜索结果 ![输入图片说明](https://images.gitee.com/uploads/images/2020/0713/172730_ff377ba6_2228567.jpeg "数据流程图.jpg") * **用户流程图** ![输入图片说明](https://images.gitee.com/uploads/images/2020/0713/172632_147cb60e_2228567.jpeg "psearch流程图.jpg") * **信息设计** ![输入图片说明](https://images.gitee.com/uploads/images/2020/0717/214122_789312d2_2228567.png "信息设计.png") ![输入图片说明](https://images.gitee.com/uploads/images/2020/0717/214132_7a6934d1_2228567.png "信息设计2.png") * **用户可欲性** :用户在APP中只有一种身份:使用者。用户可以使用多种方式上传图片信息给后台获取结果,已达到相册整理或图片搜索的目的。流程清晰方便,没有其他多余的操作干扰。 * **技术可行性** : * 图片搜索:以图搜图,在指定图库中搜索出相同或相似的图片,适用于图片精确查找、相似素材搜索、拍照搜同款商品、相似商品推荐等场景,可以有效帮助用户完成相册整理、原图搜索的需求。 * 图片识别:精准识别超过十万种物体和场景,包含多项高精度的识图能力并提供相应的API服务,充分满足用户图片内容识别并获取详细信息的需求。 * **商业可行性** :百度api可应用于新闻资讯类服务、信息检索服务、视频类APP、个性化推荐等业务场景中,特色优势,功能丰富,支持多种垂类业务场景的细粒度图像识别,我们的产品可以和商品商家、图像资讯平台合作,我们可以获得更多图片学习数据和来源,合作方可以增加曝光度,开阔浏览渠道。 * **原型文档** :[交互演示](https://modao.cc/app/e1680643e85a5571b77a08fefd6cbe86b295cbd7?simulator_type=device&sticky) --- ### API的运用 (一) **百度 AI** :[图像搜索](https://ai.baidu.com/tech/imagesearch)-[相同图片搜索](https://ai.baidu.com/ai-doc/IMAGESEARCH/Ck3bczreq)、[相似图片搜索](https://ai.baidu.com/ai-doc/IMAGESEARCH/3k3bczqz8) 1. 相同图片搜索api接口描述:该请求用于搜索图库相同图片,支持找到局部内容相同的大图,或适度调整背景和角度的相同图片;可用于图片精确查找、重复图片过滤等场景。 [接口地址](https://aip.baidubce.com/rest/2.0/realtime_search/same_hq/search) 2. 相似图片搜索api接口描述:该请求用于搜索相似的图片(综合图片类型、颜色、内容、布局等特征);适用于各种相似图片查找、相关内容推荐场景。[接口地址](https://aip.baidubce.com/rest/2.0/image-classify/v1/realtime_search/similar/search) * 请求方法:POST方式调用 1. 首先通过API Key和Secret Key获取的access_token。 2. 接着识别输入的图片。 [输入与输出代码详细展示](https://www.jianshu.com/p/fab9bc26a5bc) ``` from aip import AipImageSearch # 先建立客户端 """ 你的 APPID AK SK """ APP_ID = '21273006' API_KEY = '你的key' SECRET_KEY = '你的secret key' client = AipImageSearch(APP_ID, API_KEY, SECRET_KEY) AipImageClassify = AipImageSearch(APP_ID, API_KEY, SECRET_KEY) """ 读取图片 """ def get_file_content(filePath): with open(filePath, 'rb') as fp: return fp.read() image = get_file_content('5.jpg') """ 调用相同图像检索—检索, 图片参数为本地图片 """ client.sameHqSearch(image); """ 带参数调用相同图像检索—检索, 图片参数为本地图片 """ client.similarSearch(image) result = AipImageClassify.sameHqSearch(image) print(result) ``` (二) **百度 AI** :[图像识别](https://ai.baidu.com/tech/imagerecognition)-[通用物体和场景识别](https://ai.baidu.com/ai-doc/IMAGERECOGNITION/Xk3bcxe21) * 通用物体和场景识别接口描述:该请求用于识别图片内容以及获取详细信息,接口返回大类及细分类的名称结果。同时接口返回百科词条URL、图片和摘要描述,可选择是否需要返回百科信息。[接口地址](https://aip.baidubce.com/rest/2.0/image-classify/v2/advanced_general) * 请求方法:POST方式调用 1. 首先通过API Key和Secret Key获取的access_token。 2. 接着识别输入的图片。 [输入与输出代码详细展示](https://www.jianshu.com/p/29df98624684) ``` from aip import AipImageClassify """ 你的 APPID AK SK """ APP_ID = '21262395' API_KEY = '你的key' SECRET_KEY = '你的secret key' client = AipImageClassify(APP_ID, API_KEY, SECRET_KEY) AipImageClassify = AipImageClassify(APP_ID, API_KEY, SECRET_KEY) """ 读取图片 """ def get_file_content(filePath): with open(filePath, 'rb') as fp: return fp.read() image = get_file_content('2.jpg') """ 如果有可选参数 """ options = {} options["baike_num"] = 5 """ 调用通用物体识别 """ AipImageClassify.advancedGeneral(image,options); """ 带参数调用通用物体识别 """ result = AipImageClassify.advancedGeneral(image,options) print(result) print(result["result"][0]) ``` --- ### API使用比较分析 * 竞争者比较:阿里云、腾讯 * 战略定位分析 | 竞品 | 简介 | 定位 | 优势 | | -------- | ----- | :----: | :----: | | [阿里云图像识别](https://help.aliyun.com/document_detail/145017.html?spm=a2c4g.11186623.6.668.69084c684D073D) | 图像识别技术是基于阿里云深度学习技术,可实现精准识别图像中的视觉内容,包括上千种物体标签、数十种常见场景等,为您提供图像打标、场景分类、颜色识别、风格识别以及元素识别等能力。 | 适合于广告营销行业的元素、风格、场景等图像识别 | 支持视频场景识别功能,能实现对视频全自动且准确的快速识别 | | [阿里云图像搜索](https://help.aliyun.com/document_detail/66657.html?spm=5176.234465.1357402..760135c8hA9lgF) | 图像搜索服务 (Image Search)是以深度学习和大规模机器学习技术为核心,通过图像识别和搜索功能,实现以图搜图的智能图像搜索产品。 | 商品信息为主的图像搜索,适用于不同行业应用和业务场景 |有实时化接口,支持实时增删数据 | | [腾讯智能识图](https://cloud.tencent.com/product/iir/details) | 腾讯云智能识图提供多种高质量的图像理解能力,包含商品、物品、花草、地标等,帮助您“理解万物”。首先对外开放商品识别能力,具有品类全、识别准、使用成本极低等优势。覆盖上亿 SKU、全品类商品;识别同款率效果优异,用户体验极佳;不用自建商品库,节省时间和资源投入,快速接入拍照搜商品能力。 | 全品类、高精度的智能图像识别 | 智能识图与微信联合,能更加准确识别主体 | * 综合比较结果:在比较阿里云和腾讯云两个智能AI平台后,我发现阿里云的智能市场占比最高,技术成熟,折扣优惠大,还涉及电商行业,在商品识别这一部分占优势。在API调用操作上腾讯云对新手开发者更友好,在人工智能产品介绍里提供完整代码可以学习,但对于Psearch图片搜索应用来说,腾讯云只有图像识别的分类,没有图像搜索,无法满足该产品的功能需求,阿里云的图像搜索在商品搜索比较占优势,但是通用图像库不及百度10万个常见物体及场景,且百度支持搜索结果链接百度百科,信息更完整,更满足该产品的识别图像内容的需求。所以综合以上,我选择了百度的API。 --- ### 产品风险报告 #### API的免费额度与使用价格 * [图像识别](https://ai.baidu.com/ai-doc/IMAGERECOGNITION/Yk3bcxagu) 图像识别下各个能力都具有免费调用额度,开通付费后,免费调用额度仍保留。开始产生调用次数时,优先抵扣免费额度,超出免费额度后按次计费。免费额度如下: | 产品服务 |免费调用额度 |超出免费额度 | | ---- | ---- | ---- | | 通用物体和场景识别 | 500次/日| 可开通按调用量后付费或购买次数包,按次计费,支持购买QPS叠加包 | | 图像主体检测(单主体) |500次/日|可开通按调用量后付费或购买次数包,按次计费,支持购买QPS叠加包 | * [图像搜索](https://ai.baidu.com/ai-doc/IMAGESEARCH/Ck3bczqk2) 图像搜索共包括三项服务:相似图片搜索、相同图片搜索、商品图片搜索。其中每项服务包括入库、检索、删除、更新四个接口。每个接口每天均提供一定额度的免费调用量供测试使用。 入库与检索接口超出 免费额度 后,可选择购买次数包 或开通 按调用量后付费 两种计费方式付费使用,两种付费方式均可在 控制台 直接开通或购买,开通付费后默认按量后付费的方式进行阶梯计费,如有购买对应服务的次数包,则优先消耗次数包额度,抵扣完毕后自动转为按量后付费方式。 图像搜索各项服务,免费使用和开通付费所使用的服务相同 ,识别效果与性能相同,但开通付费后的服务配置有较大提升 ,具体对比如下: | 状态 |免费调用额度 |超过免费额度 |QPS限制| | ---- | ---- | ---- | ---- | | 免费状态 | 拥有| 不响应请求| 500次/日| 不保证并发 | | 付费状态 |拥有|可继续请求 |保证10次并发| #### 产品的未来发展性 [图像搜索文章链接](http://www.chyxx.com/industry/201612/475005.html) [图像识别文章链接](https://www.sohu.com/a/211705384_606872) 1. 技术方面 该产品具有明确的核心价值和使用需求。在腾讯云、阿里云等多种可以实现产品功能的技术中,我选择了最符合产品需求和用户用户痛点的百度API加值,该产品存在较小的技术风险,对比其他两家智能平台这个风险也存在,但是此小概率风险对用户体验的负面影响不会压过正面影响的机率。 2. 市场方面 用户群体广泛,需求明显,本产品的核心价值能满足用户的需求。市场同类产品较多,未来需求趋势在逐步增长。 3. 商业方面 图像识别和搜索的应用十分广泛,其中可以和商品商家合作,对于商品场景的图像识别成功后用户可以通过点击外链跳转到相应的商城平台查看详细信息。 #### 使用风险及处理办法: 1. 该技术可能被非法获取用来监视用户手机的相册数据,用户可能面临隐私泄露的风险。对于这个问题,产品在收集使用个人信息和开启手机权限前应征得用户同意,在用户未使用时不自动开启。[文章链接](http://www.banyuetan.org/kj/detail/20180827/1000200033136211535334161295975845_1.html) 2. 图像识别和搜索后的结果不准确:需要具备更为庞大的图像库,不断强化机器学习,收集用户反馈回来的错误数据,不断校正学习,使得多种复杂的图像场景在海量图库中也能精准识别。[文章链接](https://www.sohu.com/a/232085593_784664) 3. 搜索结果可能包含敏感信息或不友好的信息,给用户带来风险隐患和不好的体验。对于这个问题的处理方式可以增加审核过滤机制,通过图片颜色轮廓、文字、来源检测识别,或者累积一定数据,训练深度学习模型,智能筛选索索结果。 --- ### 心得总结及感谢 1. 在写这份项目文档过程中,参考了往期师兄师姐的作品和文档结构,使我的产品文档更加严谨和完整,在此需要对提供项目参考的学姐表示感谢,以下是我参考的师姐作品链接: * [黄滢师姐作品“savor”APP](https://github.com/NFUNM032/app-of-savor) * [詹晓燕师姐作品“Art Gallery”APP](https://github.com/xlayal/Art_Gallery_Tour) 2. 感谢各大开放平台提供的免费资源调用,我所使用的智能AI功能调用官方文档链接: * [百度AI图像搜索](https://ai.baidu.com/tech/imagesearch)-[相同图片搜索](https://ai.baidu.com/ai-doc/IMAGESEARCH/Ck3bczreq) * [相似图片搜索](https://ai.baidu.com/ai-doc/IMAGESEARCH/3k3bczqz8) * [百度AI图像识别](https://ai.baidu.com/tech/imagerecognition)-[通用物体和场景识别](https://ai.baidu.com/ai-doc/IMAGERECOGNITION/Xk3bcxe21) API的价值主张总结:通过了解图像搜索识别的产品市场情况以及用户分析得出该APP的价值主张,对比竞争产品,选择了最合适的API设计本产品原型,进一步满足用户的多方面需求。 ### 迭代增量说明 * 增加语音旁白讲述的Powerpoint投影片 * 增加用户画像 * 增加用户的使用场景 * 增加需求论证展示利害相关者分析 * 增加部分api调用代码展示 * 增加界面流程设计的用户可欲性、技术可行性和商业可行性 * 增加数据流程设计的用户可欲性、技术可行性和商业可行性 * 增加用户旅程地图 #### Gitee的diff连结 [diff连结链接](https://gitee.com/angelakn/api/compare/fb480bf17b781d87842dd33d19740e163ca76ebf...master)