学术|00后之光:4名高中生开发的这款App,让视障人群重获出行自由( 二 )


“这四个孩子想为世界带来改变,”Ahn 说 。“他们想帮助别人,这是从一个非常无私的立场出发的 。他们很聪明、很勤奋、很专注 。”
技术的构建这款 APP 以信息处理渠道、搜索和避障算法,旨在达到低延迟和高精度执行用户请求的目的 。该应用程序使用最新的计算机视觉模型和机器学习技术来提高其对对象进行分类的准确性 。
它还包括一个领先的对象检测模型,一个用于视觉和语言研究的多模态框架,一个视觉问答程序和一个文本识别算法 。
数据在移动设备上本地处理,而不是通过云服务进行处理,所以无论是否有蜂窝信号,都可以满足用户请求 。
“通过测试,我们意识到无论用户身在何处,服务才是最重要的,”Ravella 说 。"将我们庞大而沉重的计算机视觉模型转换为可以在 iPhone 上运行是一个巨大的挑战 。但是,多亏了iPhone的神经引擎,让这一切有了实现的可能 。"
Ravella 说,该应用程序目前仅在 iOS 上可用,因为 iPhone 是测试该设备的人中最受欢迎的,并且该软件具有更多的辅助功能 。他说,它还允许同学们将硬件开发转移到苹果身上,更多地关注软件,因为苹果拥有出色的 iPhone 相机、深度技术、处理能力和电池寿命 。
市场上的盲人辅助设备可能高达 6000 美元,但 Atheia 用户每月只需花费约10美元的订阅费即可 。
重视用户反馈同学们第一次尝试使用辅助设备时戴着带摄像头的手套,但这次实验并没有成功,因为它是在没有潜在用户输入的情况下设计的 。
“我们陷入了一个许多人都会遇到的陷阱,”Choi 说,“我们首先创建了一个解决方案,然后找到了匹配的确切问题,但这些问题并不是你用这些设备应该去解决的问题” 。由于 疫情的限制,他们无法进行面对面的采访,于是孩子们在 Facebook 上发帖寻找有视力障碍的志愿者,向他们咨询视障人群的首要需求 。
学术|00后之光:4名高中生开发的这款App,让视障人群重获出行自由
文章图片

图 | Nafi(左)和Choi(右)正在将显示 Atheia 应用程序的 3D 打印原型手镯的部件粘合在一起 。这是该团队测试但被否定的六个原型之一(来源:IEEE Spectrum)
“他们愿意给我们反馈,还激励我们不断创新,对我们的研究十分期待,”Ravella 说 。
根据这些反馈,团队放弃了手套,开始开发腕戴式和头戴式设备,并最终开发移动应用程序 。他们确保获得有关他们六个原型中每个原型的输入 。
为了了解要使用哪些技术,Ahn 帮助学生从包括 IEEE Spectrum 在内的各种 IEEE出 版物中获取研究文章 。
在花费数百美元购买零件并支付软件费用后,孩子们找到了合作伙伴来帮助支付开发成本 。他们的合作伙伴包括 Amazon Web Services,Maximus 基金会,麻省理工学院的辅助技术部门和 Ultralytics 。
年轻的研发者们对于未来的畅想提到未来的职业畅想,四位同学不约而同地表示,他们都打算从事 STEM 职业 。
Ravella 说,他想研究机器学习在网络安全中的应用 。在 MITRE 和哥伦比亚大学实习期间,他了解到黑客闯入物联网设备过于容易,让人十分担忧 。
Nafi 想参与计算机视觉研究,其中融合了"物理学的混合体" 。他曾在达特茅斯学院从事数字病理学研究 。
Choi 依旧想从事计算机视觉方面的职业 。他非常喜欢 Atheia 项目,以及他在乔治梅森大学(George Mason University)实习期间使用计算机视觉开发的另一个项目 。

推荐阅读