# phkit **Repository Path**: bigcash/phkit ## Basic Information - **Project Name**: phkit - **Description**: github mirror - **Primary Language**: Python - **License**: MIT - **Default Branch**: main - **Homepage**: https://github.com/kuangdd/phkit.git - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 0 - **Created**: 2022-12-29 - **Last Updated**: 2022-12-29 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README ![phkit](phkit.png "phkit") ## phkit phoneme toolkit: 拼音相关的文本处理工具箱,中文和英文的语音合成前端文本解决方案。 #### 安装 ``` pip install -U phkit ``` #### 版本 v0.2.11 ### pinyinkit 文本转拼音的模块,依赖python-pinyin,jieba,phrase-pinyin-data模块。 ### chinese 适用于中文、英文和中英混合的音素,其中汉字拼音采用清华大学的音素,英文字符分字母和英文。 - 中文音素简介: ``` 声母: aa b c ch d ee f g h ii j k l m n oo p q r s sh t uu vv x z zh 韵母: a ai an ang ao e ei en eng er i ia ian iang iao ie in ing iong iu ix iy iz o ong ou u ua uai uan uang ueng ui un uo v van ve vn ng uong 声调: 1 2 3 4 5 字母: Aa Bb Cc Dd Ee Ff Gg Hh Ii Jj Kk Ll Mm Nn Oo Pp Qq Rr Ss Tt Uu Vv Ww Xx Yy Zz 英文: A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 标点: ! ? . , ; : " # ( ) 注:!=!!|?=??|.=.。|,=,,、|;=;;|:=::|"=""“”''‘’|#=#   |(=(([[{{【<《|)=))]]}}】>》 预留: w y 0 6 7 8 9 注:w=%|y=$|0=0|6=6|7=7|8=8|9=9 其他: _ ~ - * ``` #### symbol 音素标记。 中文音素,简单英文音素,简单中文音素。 #### sequence 转为序列的方法,文本转为音素列表,文本转为ID列表。 拼音变调,拼音转音素。 #### pinyin 转为拼音的方法,汉字转拼音,分离声调。 拼音为字母+数字形式,例如pin1。 #### phoneme 音素映射表。 不带声调拼音转为音素,声调转音素,英文字母转音素,标点转音素。 #### number 数字读法。 按数值大小读,一个一个数字读。 #### convert 文本转换。 全角半角转换,简体繁体转换。 #### style 拼音格式转换。 国标样式的拼音和字母数字的样式的拼音相互转换。 ### english from https://github.com/keithito/tacotron " Cleaners are transformations that run over the input text at both training and eval time. Cleaners can be selected by passing a comma-delimited list of cleaner names as the "cleaners" hyperparameter. Some cleaners are English-specific. You'll typically want to use: 1. "english_cleaners" for English text 2. "transliteration_cleaners" for non-English text that can be transliterated to ASCII using the Unidecode library (https://pypi.python.org/pypi/Unidecode) 3. "basic_cleaners" if you do not want to transliterate (in this case, you should also update the symbols in symbols.py to match your data). ### 历史版本 #### v0.2.10 - ttskit适配的音素工具。