利用 AI 提高女性怀孕几率

  • Babyndex 依托 Ximilar 的机器学习平台,推出一款排卵检测镜及唾液结晶评估 AI 应用解决方案,借计算机视觉和机器学习之力,帮助育龄女性更轻松准确地确定最佳受孕期。Ximilar 平台在英特尔® 分发版 OpenVINO™ 工具包和英特尔® 至强® 可扩展处理的支持下,不仅帮助 Babyndex 攻克多种难题,同时也收获了系统加速、扩展能力提升、节约计算资源等益处。

author-image

作者

每六对夫妻中,就有一对在尝试怀孕一年多后仍难以受孕2。这种情况会让人大受打击,尤其是那些生理期不规律又想要怀孕的女性。为了帮助她们更好地了解自己的受孕期,Babyndex 开发出一种解决方案,将简单的唾液测试和排卵检测镜与人工智能 (AI) 应用结合起来。

借助计算机视觉和机器学习,该应用可帮助女性更轻松、更准确地识别唾液结晶3。通过识别可指示受孕窗口期的唾液结晶,女性可以提高怀孕的几率。为了开发和部署该应用的先进算法,Babyndex 找到专攻医疗技术视觉 AI 的专业机构 Ximilar,并采用了其面向英特尔® 架构优化的机器学习平台。


挑战

• 借助排卵检测镜帮助自己判断受孕情况的女性往往觉得靠肉眼很难准确识别唾液结晶,导致她们在不知情的情况下错过了自己的最佳受孕期。
• Babyndex 希望开发一款基于 AI 的应用,帮助女性更好地识别唾液结晶。然而,Babyndex 只能收集到很有限的图像数据集来构建和训练其算法。
• 而且,反馈符合用户期望的准确 AI 推理结果需要大量算力,且时延要低。


解决方案

• Babyndex 和视觉 AI 服务提供商 Ximilar 合作构建、训练并部署了基于其有限数据集开发的机器学习算法。
• Ximilar 创新的 “流程式” 方法将复杂的机器学习问题分解成若干独立的小型任务,并将它们连成一个图像处理流程,使 Babyndex 能够随着时间的推移提高其模型的准确率。
• 作为英特尔® AI Builders 的成员,Ximilar 可较早获得英特尔的技术路线图,因此能够及时优化自己的机器学习即服务 (MLaaS) 平台,以便基于英特尔® 处理器在云端运行推理。


结果

• Ximilar 模块化的流程式方法和面向英特尔® 架构优化的 MLaaS 平台使 Babyndex 得以推出这款可自动识别唾液结晶的应用,帮助女性了解她们的受孕期。
• Ximilar 如今可在标准的英特尔® CPU 而非专用加速器上运行自己所有的模型,这能够帮助 Babyndex 等企业提高硬件利用率并节省成本。
• Babyndex 通过实现唾液排卵测试的数字化,并将数据保存在用户个人日历中,使女性能够以更经济的方式准确地确定自己实际的受孕窗口期。


利用唾液结晶识别受孕期

大多数受孕期监测应用依靠的是基础体温 (BBT) 测试或促黄体生成素 (LH) 尿液测试。这些测试只能预测到排卵的前后一天,但其实受孕窗口期在排卵的五天前就开始了。这一偏差意味着基于 BBT 或 LH 的监测必须收集到女性至少三个生理期的排卵数据,才能支持一个精密的预测算法。

然而,如果女性的生理期不规律(例如,那些临近绝经期的女性),那么再出色的算法也无法做出准确预测。对于这类女性而言,必须要检测不太明显的生物标记,才能知道自己的最佳受孕期(即排卵的前两天)。

其中一项指标就是与体液的结构性变化相关的雌激素上升情况。盐分水平的提高会形成羊齿状的唾液结晶。在受孕期,大多数女性的唾液风干后会形成结晶。女性可以借助昂贵的电解质检测仪或排卵检测镜来识别唾液结晶,从而发现自己什么时候受孕几率较高。

目前,大多数女性都是用肉眼来判断是否有结晶。有时,她们等待的时间过短,还未看到唾液风干形成结晶;样本中的唾液量太多也可能会阻碍结晶形成;又或者有结晶,但她们没看出来。

为了帮助她们,Babyndex 着手开发了一款采用计算机视觉和机器学习算法来进行图像识别的应用。这款基于 AI 的应用能够更轻松、更准确地识别唾液结晶的形成。此外,它还有个人排卵日历的功能。如果用户发现自己连续几天都有相当水平的羊齿状结晶形成,她就可以假定自己正处于受孕的窗口期。


整理唾液结晶图像的数据集

开发、训练和部署计算机视觉模型会在图像识别的精度和性能上面临巨大挑战。在开发阶段,用例所需的数据特征在标记和分类上的准确性至关重要。对 Babyndex 而言,这个问题又尤其复杂,因为其用于构建可运行的模型的图像数量十分有限。

Babyndex 的联合创始人和共同发明人 Zajzon Bodó 解释道:“在开发初期,我们收集了数百张带有唾液结晶的干燥唾液样本图像。这项工作听起来可能很容易,但其实耗费了两年多的时间。”

“大多数女性采用激素避孕,欺骗自己的身体,使其认为自己怀孕了。但她们其实并没有排卵,也没有受孕窗口期或唾液的蕨样变。那些未采取避孕的女性来见 Babyndex 的妇科医生时会按要求提供唾液样本。然而,她们中只有少数人恰好处于排卵期前,且唾液中含有结晶。”

基于数量如此有限的数据集构建可运行的模型非常具有挑战性。尽管如此,Babyndex 并没有退缩。2016 年提交了专利申请后,Babyndex 便开始寻找机器学习提供商帮助自己实现应用的落地。

图 1. Ximilar 应用中的唾液样本。

基于有限数据集构建和训练模型

“大学和研究机构的检测服务非常昂贵,而(当时新兴的)在线图像分析服务的提供商要么产品概念模糊,要么商业模式不明,” Bodó 回忆时说:“我们只需要检测结晶体,不需要其他,另外还要避免供应商锁定。然后,我们就遇到了 Ximilar。他们提供的产品技术似乎正是我们所需要的。”

“然而,我们在数据保护、性能和可扩展性方面仍有顾虑。我们组织召开了一次会议,了解到用户数据将存储在欧洲,这就意味着项目的起步不会受到欧盟《通用数据保护条例》(GDPR) 的牵制。”

“我们还了解到,Ximilar 在美国也有客户。他们清楚有关医疗和个人资料的数据保护要求,也有能力处理欧美两地的可扩展性问题。我们被说服了,随后就上传了有着几百张图片的初始数据集,并训练了我们的机器学习算法。结果,我们成功了,而且速度非常快,非常稳定可靠。”

Babyndex 和 Ximilar 共同制定了唾液结晶图像标注规则。他们在数据集中增加了元数据来标记 Babyndex 希望其计算机视觉模型能够识别的数据特征,并加以分类。然后,Babyndex 将这些标注应用于一组模型,以测试哪个模型在自己的用例中更为有效。

找到合适的计算机视觉模型后,Babyndex 就开始了进一步的训练,以便为用例找到准确的收敛点。最后,Babyndex 部署了该计算机视觉模型,针对过去未见过的数据集进行推理。

今天,随着用户不断上传图像,数据集规模在持续增长,Babyndex 的算法因此也在轻松、快速地提升。Bodó 说:“我们很有信心,图像数据分类方面的专业支持将使我们能够在以更高的准确率识别受孕窗口期方面长期保持竞争优势。”

Ximilar 的首席执行官兼联合创始人 David Novák 表示:“Ximilar 平台正是为基于小型数据集构建和训练模型而设计。我们将机器学习问题分解成若干独立的小型任务,比如分类或检测任务,接着我们再将这些模型连成一个图像处理流程。”

“这种方法使我们能够持续、动态地提升独立模型的质量。只需轻点鼠标,就能应用准确率更高的新模型,而系统的其他部分不受影响。我们能够做到在提高一个模型的准确性时,不对其他模型的准确性产生不良影响。这让我们能够在使用有限数据集的基础上取得如此巨大的成功。” 


面向英特尔® 架构优化 Ximilar 平台

Ximilar 在 GPU 和 CPU 上都运行了其云端机器学习即服务 (MLaaS) 平台。Novák 说:“尽可能高效地运行基础设施并提供高质量的结果对我们来说非常重要。如今,要获得出色的算力并没有那么困难。而将这些 CPU 的潜力充分挖掘出来是我们与众不同之处。我们致力于节约能源和资源,同时提供价格合理的服务。”

Ximilar 与英特尔合作优化了其机器学习平台的速度并全面提高了基础设施的效率。其用于图像识别的机器学习模型先在基于 GPU 卡的 TensorFlow 2+ 上进行训练,然后再使用英特尔® 分发版 OpenVINO™ 工具包进一步优化。随后,推理引擎在第二代英特尔® 至强® 可扩展处理器上运行面向英特尔® 架构优化的模型,处理所有涌入的预测 API 请求。

使用英特尔® 分发版 OpenVINO™ 工具包后,Ximilar 可以充分利用英特尔® 至强® 可扩展处理器内置的英特尔® 高级矢量扩展 512 (英特尔® AVX-512)加速功能。

现在,Ximilar 所有的模型都在标准的英特尔® CPU 上运行,无需使用专用加速器。这可以节省用于训练的 GPU 算力资源,从而提高硬件的利用率并降低成本。

David Novák 说:“我们的硬件都是自有的。如果生产能力已满,我们就要购买新的服务器。有了英特尔的这些优化,服务器处理各项任务的速度都提高了,因此我们生产能力达到满负荷状态的时间点就延后了。这也为我们节省了 GPU 硬件的成本。”

作为英特尔® AI Builders 的成员,Ximilar 能直接获得技术资源和支持,并且可以测试、优化并集成英特尔未来推出的技术。

Ximilar 的联合创始人 Michal Lukáč 表示:“英特尔® AI Builders 团队非常专业,我们合作得十分愉快。在看到优化结果后,我可以说,加入英特尔® AI Builders 计划是我们今年最重要的一项成就。现在,我们既实现了系统加速,提高了可扩展性,还节约了计算资源。”


提高女性怀孕几率

Ximilar 采用模块化流程式方法来构建模型,并基于有限的数据集进行训练,这让 Babyndex 成功实现并优化了这款能够帮助女性更好地识别唾液结晶体的应用1。即使是生理期不规律的女性,现在也能够在这款经济型受孕期监测应用的帮助下,更为准确地了解自己的最佳受孕期。Ximilar 面向英特尔® 架构优化的机器学习平台可满足用户期望,提供快速、准确的推理结果。

Babyndex 基于 AI 的应用可帮助想要怀孕的女性更好地使用排卵检测镜,由此预测她们的最佳受孕期,大大提高怀孕几率。与传统的受孕期监测应用相比,Babyndex 的应用能够更准确地指出女性的受孕窗口期3。和其他基于激素水平和皮肤状况的测试相比,它的价格更低4

图 2. Ximilar 应用中的 Babyndex 流程。

使用 Babyndex 应用识别受孕期

1. 使用该应用时,用户需先将少量唾液涂抹在由 Babyndex 提供的检测镜镜头上,并等待其干燥。

2. 然后,用户可使用已下载到智能手机上的应用,将手机摄像头对准检测镜,拍摄一张唾液样本的照片。

3. 接下来,Babyndex 的算法就会分析唾液的形态并确定存在结晶的概率。

展望未来

如今,Babyndex 正计划进一步拓展该应用的机器学习功能,实现全 AI 化。Babyndex 希望利用更多个人数据(如年龄、体重等)来增强其图像数据。通过这样做,Babyndex 希望能直接预测受孕的几率,而不仅仅是存在唾液结晶的概率。

Ximilar 正与英特尔工程师持续展开合作,优化其物体检测、去除背景和分割模型,希望在不使用 GPU 的前提下提升模型的速度,构建出色、易用的计算机视觉、图像识别、检测和相似搜索平台。

Ximilar 也期待着使用英特尔® 分发版 OpenVINO™ 工具包对自己更多的服务和模型进行优化,使其基于英特尔® 至强® 可扩展处理器运行的整个平台运行速度更快。

英特尔® AI Builders 团队非常专业,我们合作得十分愉快。在看到优化结果后,我可以说,加入英特尔® AI Builders 计划是我们今年最重要的一项成就。现在,我们既实现了系统加速,提高了可扩展性,还节约了计算资源。我们与英特尔的营销合作也有利于我们把自己独特的产品展示给更多的潜在客户。”

——Michal Lukáč, Ximilar 联合创始人及机器学习专家

关于 Babyndex 

Babyndex 团队 2016 年成立于匈牙利的格德勒。创立伊始,团队就开始着手打造一款自动化应用,帮助女性解读唾液排卵测试结果,了解自己的最佳受孕期。其独特的数据库和先进的算法显著提高了这种可复用测试的准确率。女性因此能够更快预测自己最有可能怀孕的时间窗口。该项唾液测试已经通过 FDA 认证。更多信息,请见:https:// www.babyndex.eu/


关于 Ximilar 

Ximilar 是一家软件公司,致力于帮助企业通过人工智能和机器学习更好地利用图像数据。该公司专注于计算机视觉、图像识别和视觉搜索领域。Ximilar 提供计算机视觉平台,用于构建自定义深度学习视觉 AI 模型。此外,公司还提供与图像识别、物体检测等相关的专业化、自定义解决方案。更多信息,请见:https://www.ximilar.com/

了解更多信息

以下资源可能对您有所帮助:
• 英特尔® 至强® 可扩展处理器
• 英特尔® AI Builders 
• Ximilar 基于流程的工作方式

找到适合您的企业或机构的解决方案。请联系您的英特尔代表或访问 intel.cn/ai

产品和性能信息

4常见的激素测试是促黄体生成素 (LH) 试纸条测试,主要评估尿液中这种激素的含量。该测试的一次性测试费用约为 1-1.50 美元。一套测试通常包括 3 至 6 次,女性通常需在一个月的若干天中进行这种测试。而生理期不规律的女性则需要更频繁地测试。一周测试的费用:7-14 美元 = 每月 28-56 美元 = 每年 336-672 美元。排卵检测镜的费用为 30-50 美元,可永久使用。此外,还有双激素尿液测试可供选择,但它们往往更加昂贵。然而,许多生理期不规律的女性还是会选择更便宜的 LH 测试。