让机器辨别气味:利用图神经网络预测分子的嗅觉属性

原文地址

嗅觉原理

嗅觉是诸多生物体共有的一种感官,在生物体分析世界并作出相应反应方面起着至关重要的作用。对人类而言,我们的嗅觉与享用美食紧密相连,并且还能唤醒与之对应的鲜活记忆。嗅觉使我们可以感受日常生活中的各种香味,例如我们熟悉的玫瑰花香、新鲜出炉的饼干醇香,抑或是最喜欢的香水味道。虽然嗅觉很重要,但在机器学习研究中它并未像视觉与听觉那般备受关注。

人类的气味感知通过激活 400 种不同类型的嗅觉感受器 (Olfactory Receptors, OR) 来实现。嗅觉感受器位于鼻腔内名为嗅觉上皮的小块状组织中,由 100 万个嗅觉感应神经元 (Olfactory Sensory Neurons, OSN) 组成。这些 OSN 将信号发送给嗅球(olfactory bulb),然后进一步传递到大脑皮层产生嗅觉。

实现原理

基于视觉和声音深度学习研究的类似进展,我们通过类比得知,即使不知道所有相关系统的复杂细节,嗅觉深度学习应该也可以直接预测出输入分子的最终感应结果。解决气味预测问题将有助于发现新的合成气味剂,从而减少取用天然产品造成的生态影响。审视生成的嗅觉模型甚至可以带来嗅觉生物学的新见解。

小气味分子是香精香料最基本的组成成分,因此也代表了最简单的气味预测问题。不过,每个分子都有多个气味描述词。例如,对于香兰素 (Vanillin)的描述词有 甜美、香草味、奶油味 和 巧克力味 等,其中的某些气味会更为明显。因此,气味预测也是一个 多标签分类 问题。

在“气味机器学习:学习小分子的可泛化感知表征” (Machine Learning for Scent: Learning Generalizable Perceptual Representations of Small Molecules) 一文中,我们利用图神经网络(Graph Neural Networks, GNNs),在不采用任何人工规则的情况下,把 图 (Graph) 输入到 GNN,直接预测单个分子的气味描述词。GNN 是一种深度神经网络,可以对图进行操作。研究证明,与目前的最新技术相比,此方法可显著提高气味预测能力,是非常有前景的未来研究方向。