求高人指点下RSC-164芯片
答案:1 悬赏:10 手机版
解决时间 2021-03-08 17:47
- 提问者网友:暮烟疏雨之际
- 2021-03-07 20:45
求高人指点下RSC-164芯片
最佳答案
- 五星知识达人网友:几近狂妄
- 2021-03-07 21:31
应用于消费类电子产品上的交互式语音集成芯片(RSC-100/164T,RSC-300/364,RSC4XX)是一种高性能、低成本的8位MCU,所有这类芯片内部集成有ADC、DAC、ROM(除了RSC-100/300)、RAM和麦克风的预放大电路,并拥有以下多种功能:与说话者无关/有关的语音识别、语音确认(PASSWORD)、语音和音乐合成,录音和回放、快速数字拨号(只有RSC-300/364)、持续监听。
产品线有两种通用目的的微处理器(RSC系列)
1. RSC-100/164T—低成本的版本(只支持4.0版本技术)
2. RSC-300/364(支持最新版本的6.0版本技术),它有更快的响应时间、先进和附加的技术(包括数字拨号,固定单词触发,同时产生数字记录和识别模板)
3. RSC-164/364产品的特性
a) 有64k内置ROM的8位微处理器;
b) 集成有A/D和D/A转换器;
c) DAC或PWM(Pulse Width Modulation);
d) 可实现DTMF 拨号;
e) 音源的AGC功能;
f) 16个通用I/O端口;
g) 片上有输出放大器;
h) 省电模式-最小的功耗(小于5UA)。
RSC-300/364产品特性
RSC-300/364是专门为消费类电子产品应用而设计的,拥有高度集成和高识别率的系统化芯片。RSC-300/364有额外的SDAM和硬件加速器去支持SENSORY的最新技术(5.0以上)。这种特别设计的8位微处理器在拥有灵活的编程时支持一系列语音技术:与说话者无关/有关的识别、语音和音乐的合成、语音确认、语音提示、持续监听、快速数字拨号、录音和回放。RSC-300/364允许在片上存储最多6个与说话者有关的短句。RSC-300与RSC-364的区别就是少一个64K的ROM,根据封装和版本的不同,RSC-300/364的价格在2.2~3.9美元之间。
RSC-4x产品特性
RSC-4x是Sensory INC.第4代的语音识别产品,它具有所有RSC-300/364的所有特性之外,还增加了不少功能。RSC-4x支持Sensory Speech™ 7技术,改进的算法使识别准确率得到提高。新增的T2SI技术使得制作SI模版节省了时间和资金投入。在语音合成算法上也作了改进,“SX™”压缩技术使得语音的压缩率可以达到3K-8K bps(bits-per-second),是原来的1/10-1/4,大大减少了存储空间,节约了成本。RSC-4x有三种型号,RSC-4000不含程序存储空间,RSC-4128 内部含128K程序存储空间,RSC-4256内部含256K程序存储空间,供用户灵活选用。
VOICE DAILER特性(ASSP)
VOICE DAILER364是为了增加语音拨号而设计的,它可应用在非手持的车载电话、手持电话、PDA、答录机和其它个人电子设备。使用者只需说出名字便可拨出相关的电话;VOICE DAILER-364芯片可管理一整套电话目录,包括名字、电话号码和语音识别模板。
SENSORY技术
与说话者有关的语音识别 (Speaker Dependent, SD)
在识别时,每个识别词语需要使用者训练两次来创建语音模板,一个模板需要占用128个字节的
存储量。由于练习的原因,一般把需识别的词汇量限制在60个以内,但超过100个也是完全可以的。通过正常设计, SENSORY的SD技术能达到99%的准确率。
与说话者无关的语音识别 (Speaker Independent, SI)
——不需要训练
SI技术是为一种指定的语系而设计的(如英语、汉语、德语),它最多能识别14条命令(识别数量由ROM的容量决定)。通过正常设计,SENSORY的SI技术能达到97%的准确率
语音确认 (Speaker Verification, SV)
同SD技术有点相似,SV能辨别出现在的一句话与原来说的是否相同。使用者可以训练1~4级密码(密码级数越多越安全)来开启设备。误识率大概在1~6%。根据环境、使用者数量、要求的安全程度的不同可设定五级训练难度。
语音自适应技术 (Speaker Adaptive, SA)
对于单用户来说,SA通过一段时间对环境和说话者声音的适应,改进相关的语音模板,从而提高识别准确率。
持续监听 (Continuous Listening, CL)
持续监听技术不需按键便可对某个特别、非连续的命令(在这之前需要静音)产生响应, SENSORY提供SI和SD两种持续监听技术。
WORD SPOTTING
——在一句话中响应某个指定词语。
WORD SPOTTING是持续监听的升级版本,它可以从正常的谈话中“捕捉”并响应某个关键词语,这种技术提供了更为自然、友好的人机界面。
快速数字拨号 (Fast Digit)
——输入电话号码和数字串
快速数字拨号采用了优化的识别算法来实现快速数字串输入,这种技术对语音拨号应用是非常理想的,辟如用在手持通信设备、个人拨号器,手机、非手持设备。
录音和回放 (Record & Playback)
——压缩的数字声音再现。
SENSORY的交互式语音处理器可以14Kbit/s的数据率来存储声音在外置的RAM上。它可用在答录机、变音器、手持录音设备上。根据回放的质量和数量要求,也可以改变片上的压缩率。录音过程中出现完全静音时,微处理器会自动去掉静音这一段来改善声音质量,节约存储空间。
语音合成 (Speech Synthesis)
——创建一个自然的使用界面。
语音效果合成是通过在片上的微处理器读取ROM上的数据实现的。SENSORY合成技术使用了时域技术来压缩语音,使数据率在10kbit/s以下,另外使用了加强的ADPCM算法来回放声音。语音合成技术降低了对手工指令的依赖,使人机界面更为友好。
音乐合成 (Music Synthesis)
SENSORY的音乐合成技术能产生四首模拟乐曲,用户也可用一种乐器的声音和音阶来自定义乐库。合成技术不同于数字录音,一首2~3分钟的歌曲只需5KB的片外存储容量,在电话机的应用中,这种功能还可以产生DTMF音,使RSC微处理器实现直接拨号功能。
产品控制
——完全的系统芯片解决方法。
RSC语音处理器可单独工作或作为协处理器来实现语音功能,通常,它是一个复杂系统的核心:它可提供可变长度的指令,传输率达到4MIPS 、两个计时器、外部存储器接口、DAC和PWM输出,麦克风预放大器、16个I/O端口等。
产品线有两种通用目的的微处理器(RSC系列)
1. RSC-100/164T—低成本的版本(只支持4.0版本技术)
2. RSC-300/364(支持最新版本的6.0版本技术),它有更快的响应时间、先进和附加的技术(包括数字拨号,固定单词触发,同时产生数字记录和识别模板)
3. RSC-164/364产品的特性
a) 有64k内置ROM的8位微处理器;
b) 集成有A/D和D/A转换器;
c) DAC或PWM(Pulse Width Modulation);
d) 可实现DTMF 拨号;
e) 音源的AGC功能;
f) 16个通用I/O端口;
g) 片上有输出放大器;
h) 省电模式-最小的功耗(小于5UA)。
RSC-300/364产品特性
RSC-300/364是专门为消费类电子产品应用而设计的,拥有高度集成和高识别率的系统化芯片。RSC-300/364有额外的SDAM和硬件加速器去支持SENSORY的最新技术(5.0以上)。这种特别设计的8位微处理器在拥有灵活的编程时支持一系列语音技术:与说话者无关/有关的识别、语音和音乐的合成、语音确认、语音提示、持续监听、快速数字拨号、录音和回放。RSC-300/364允许在片上存储最多6个与说话者有关的短句。RSC-300与RSC-364的区别就是少一个64K的ROM,根据封装和版本的不同,RSC-300/364的价格在2.2~3.9美元之间。
RSC-4x产品特性
RSC-4x是Sensory INC.第4代的语音识别产品,它具有所有RSC-300/364的所有特性之外,还增加了不少功能。RSC-4x支持Sensory Speech™ 7技术,改进的算法使识别准确率得到提高。新增的T2SI技术使得制作SI模版节省了时间和资金投入。在语音合成算法上也作了改进,“SX™”压缩技术使得语音的压缩率可以达到3K-8K bps(bits-per-second),是原来的1/10-1/4,大大减少了存储空间,节约了成本。RSC-4x有三种型号,RSC-4000不含程序存储空间,RSC-4128 内部含128K程序存储空间,RSC-4256内部含256K程序存储空间,供用户灵活选用。
VOICE DAILER特性(ASSP)
VOICE DAILER364是为了增加语音拨号而设计的,它可应用在非手持的车载电话、手持电话、PDA、答录机和其它个人电子设备。使用者只需说出名字便可拨出相关的电话;VOICE DAILER-364芯片可管理一整套电话目录,包括名字、电话号码和语音识别模板。
SENSORY技术
与说话者有关的语音识别 (Speaker Dependent, SD)
在识别时,每个识别词语需要使用者训练两次来创建语音模板,一个模板需要占用128个字节的
存储量。由于练习的原因,一般把需识别的词汇量限制在60个以内,但超过100个也是完全可以的。通过正常设计, SENSORY的SD技术能达到99%的准确率。
与说话者无关的语音识别 (Speaker Independent, SI)
——不需要训练
SI技术是为一种指定的语系而设计的(如英语、汉语、德语),它最多能识别14条命令(识别数量由ROM的容量决定)。通过正常设计,SENSORY的SI技术能达到97%的准确率
语音确认 (Speaker Verification, SV)
同SD技术有点相似,SV能辨别出现在的一句话与原来说的是否相同。使用者可以训练1~4级密码(密码级数越多越安全)来开启设备。误识率大概在1~6%。根据环境、使用者数量、要求的安全程度的不同可设定五级训练难度。
语音自适应技术 (Speaker Adaptive, SA)
对于单用户来说,SA通过一段时间对环境和说话者声音的适应,改进相关的语音模板,从而提高识别准确率。
持续监听 (Continuous Listening, CL)
持续监听技术不需按键便可对某个特别、非连续的命令(在这之前需要静音)产生响应, SENSORY提供SI和SD两种持续监听技术。
WORD SPOTTING
——在一句话中响应某个指定词语。
WORD SPOTTING是持续监听的升级版本,它可以从正常的谈话中“捕捉”并响应某个关键词语,这种技术提供了更为自然、友好的人机界面。
快速数字拨号 (Fast Digit)
——输入电话号码和数字串
快速数字拨号采用了优化的识别算法来实现快速数字串输入,这种技术对语音拨号应用是非常理想的,辟如用在手持通信设备、个人拨号器,手机、非手持设备。
录音和回放 (Record & Playback)
——压缩的数字声音再现。
SENSORY的交互式语音处理器可以14Kbit/s的数据率来存储声音在外置的RAM上。它可用在答录机、变音器、手持录音设备上。根据回放的质量和数量要求,也可以改变片上的压缩率。录音过程中出现完全静音时,微处理器会自动去掉静音这一段来改善声音质量,节约存储空间。
语音合成 (Speech Synthesis)
——创建一个自然的使用界面。
语音效果合成是通过在片上的微处理器读取ROM上的数据实现的。SENSORY合成技术使用了时域技术来压缩语音,使数据率在10kbit/s以下,另外使用了加强的ADPCM算法来回放声音。语音合成技术降低了对手工指令的依赖,使人机界面更为友好。
音乐合成 (Music Synthesis)
SENSORY的音乐合成技术能产生四首模拟乐曲,用户也可用一种乐器的声音和音阶来自定义乐库。合成技术不同于数字录音,一首2~3分钟的歌曲只需5KB的片外存储容量,在电话机的应用中,这种功能还可以产生DTMF音,使RSC微处理器实现直接拨号功能。
产品控制
——完全的系统芯片解决方法。
RSC语音处理器可单独工作或作为协处理器来实现语音功能,通常,它是一个复杂系统的核心:它可提供可变长度的指令,传输率达到4MIPS 、两个计时器、外部存储器接口、DAC和PWM输出,麦克风预放大器、16个I/O端口等。
我要举报
如以上回答内容为低俗、色情、不良、暴力、侵权、涉及违法等信息,可以点下面链接进行举报!
点此我要举报以上问答信息
大家都在看
推荐资讯