脑 - 计算机接口可以将思想转化为语音

ä¸è¦å²ç¬æåçæ§

哥伦比亚大学副教授Nima Mesgarani博士领导了这项研究并告诉他们逆他认为有很大的潜力来帮助恢复中风后恢复或肌萎缩侧索硬化症（ALS）患者的言语。更进一步，这种类型的技术也可以打开大脑连接智能手机的大门，可以让用户使用他们的思想发短信，虽然这仍然是一个方法。他的作品发表在期刊上科学报告.

“这项工作的动机之一是用于替代人机交互方法，例如用户和智能手机之间的可能接口，”他说。 “然而，这仍然远非现实，目前，使用非侵入性方法提取的信息对于语音脑 - 计算机界面应用来说还不够好。”

听取大脑 - 计算机界面产生的演讲。

为了开发新技术，Mesgarani和他的同事，来自Northwell Health Physician Partners神经科学研究所的Ashesh Dinesh Mehta博士开始研究癫痫患者的大脑活动。这些患者的大脑中已经有电极植入物来监测癫痫发作，Mesgarani和Mehta能够用它来收集研究数据。

两人要求愿意的参与者听取发言者背诵0到9之间的数字，然后记录来自该互动的大脑信号。接下来，他们训练了一个神经网络 - 一个模仿人类大脑中神经元结构的程序 - 识别信号中的模式，并使用语音合成器（称为声码器）将它们转换为机器人发声的单词。

结果是一个简短的声音片段，听起来像微软Sam从零到九。令人印象深刻的部分是讲话与研究人员测试的其他方法相比有多清楚。不过，还有很多工作要做。

“这项技术可能需要十年时间，”Mesgarani说。 “我们需要在长期，生物兼容的植入式电极和/或非侵入性神经记录方法的突破性技术方面取得更多进展。我们还需要更好地理解大脑如何表达语音，以便我们可以改进我们的解码方法。“

例如，参与这项研究的患者都进行了脑部手术以植入脑电图监测仪。这是一个极其侵入性的过程，需要开放式脑部手术，这是大多数人可能不愿意接受的事情，即使有可能恢复他们的一些言语能力。

目前，这项研究引入了一种将脑信号解码为语音的方法。如果我们弄清楚如何在不进行手术的情况下准确地检测大脑活动，我们将更接近于不仅彻底改变语言治疗，而且可能会带来大脑连接的智能手机。

脑机接口研究在过去几年中一直受到新的关注。 2017年4月，Facebook宣布在其年度F8会议期间正在开展BCI工作。 Elon Musk于2018年11月宣布，他自己的BCI初创公司Neuralink正在招聘。

抽象

听觉刺激重建是一种从诱发神经活动群体中找到声学刺激的最佳近似的技术。从人类听觉皮层重建语音创造了语音神经假体的可能性，以建立与大脑的直接通信，并且已经证明在公开和隐蔽条件下都是可能的。然而，重建语音的低质量严重限制了该方法用于脑 - 计算机接口（BCI）应用的效用。为了推进语音神经假体的最新技术，我们将深度学习的最新进展与语音合成技术的最新创新相结合，以重建来自人类听觉皮层的闭合可理解语音。我们研究了重建精度对线性和非线性（深度神经网络）回归方法的依赖性以及用作重建目标的声学表示，包括听觉谱图和语音合成参数。此外，我们比较了低和高神经频率范围的重建精度。我们的结果表明，直接估计所有神经频率的语音合成器参数的深度神经网络模型在数字识别任务上获得最高的主观和客观分数，相比使用线性回归的基线方法提高了65％的可懂度。重建听觉谱图。这些结果证明了深度学习和语音合成算法在设计下一代语音BCI系统方面的功效，这不仅可以恢复瘫痪患者的通信，而且还有可能改变人机交互技术。

相关视频：脑波感应机器人可以作为人体的延伸

脑 - 计算机接口可以将思想转化为语音

ä¸è¦å²ç¬æåçæ§

目录:

抽象

ä¸è¦å²ç¬æåçæ§