让机器辨别气味：利用图神经网络预测分子的嗅觉属性

嗅觉原理

嗅觉是诸多生物体共有的一种感官，在生物体分析世界并作出相应反应方面起着至关重要的作用。对人类而言，我们的嗅觉与享用美食紧密相连，并且还能唤醒与之对应的鲜活记忆。嗅觉使我们可以感受日常生活中的各种香味，例如我们熟悉的玫瑰花香、新鲜出炉的饼干醇香，抑或是最喜欢的香水味道。虽然嗅觉很重要，但在机器学习研究中它并未像视觉与听觉那般备受关注。

人类的气味感知通过激活 400 种不同类型的嗅觉感受器 (Olfactory Receptors, OR) 来实现。嗅觉感受器位于鼻腔内名为嗅觉上皮的小块状组织中，由 100 万个嗅觉感应神经元 (Olfactory Sensory Neurons, OSN) 组成。这些 OSN 将信号发送给嗅球(olfactory bulb)，然后进一步传递到大脑皮层产生嗅觉。

实现原理

基于视觉和声音深度学习研究的类似进展，我们通过类比得知，即使不知道所有相关系统的复杂细节，嗅觉深度学习应该也可以直接预测出输入分子的最终感应结果。解决气味预测问题将有助于发现新的合成气味剂，从而减少取用天然产品造成的生态影响。审视生成的嗅觉模型甚至可以带来嗅觉生物学的新见解。

小气味分子是香精香料最基本的组成成分，因此也代表了最简单的气味预测问题。不过，每个分子都有多个气味描述词。例如，对于香兰素 (Vanillin)的描述词有甜美、香草味、奶油味和巧克力味等，其中的某些气味会更为明显。因此，气味预测也是一个多标签分类问题。

在“气味机器学习：学习小分子的可泛化感知表征” (Machine Learning for Scent: Learning Generalizable Perceptual Representations of Small Molecules) 一文中，我们利用图神经网络（Graph Neural Networks, GNNs），在不采用任何人工规则的情况下，把图 (Graph) 输入到 GNN，直接预测单个分子的气味描述词。GNN 是一种深度神经网络，可以对图进行操作。研究证明，与目前的最新技术相比，此方法可显著提高气味预测能力，是非常有前景的未来研究方向。