4006156615
新闻动态
联系我们
承德亮眼睛生物科技有限公司
地址:河北省承德市双滦区宝鼎花园2期 16栋103号底商(三小门口东侧)亮目视光
服务中心:18661249978
联系人:赵总
公司新闻版权所有,抄录必究 版权登记号:国作登字-2021-L-00153496
大脑认知视觉
发布时间:2023-2-20  浏览次数:214

大脑认知视觉:

        人脑对运动的识别是一个很大的问题,目前来说没有完整解决。仅仅探究认知上人脑的运动检测功能,或许并不能完整的解释人脑对运动识别的可靠性。还需要知道人眼的凝视(gaze)能力和该能力的实现的神经基础。而这一点,正是目前我们在计算机的运动追踪中很少被考虑到的。

1.视觉通路(Visual Pathway)与视网膜拓扑映射(Retinotopy):

        人眼的左、右眼各有鼻侧和颞侧视野,在视网膜(Retina)感知光信号之后,左右两侧的视神经将信号向后传递,在视交叉(Optic Chiasma)将各自的鼻侧和颞侧信号分流并继续向后传递,分流之后左侧神经只传递右侧视觉信号(左眼鼻侧视野和右眼颞侧视野),右侧神经质传递左侧视觉信号(左眼颞侧视野和右眼鼻侧视野),分别通过两侧的外侧膝状体(LGN, Lateral Geniculate Nucleus),继续传递到枕叶的初级视皮层(V1, Primary Visual Cortex)和更高级的视皮层. 易于理解的,视网膜感知的物体,通过该通路,会以一定空间关系映射视皮层上, 该关系被称为视网膜拓扑映射(Retinotopy)。

    基于该拓扑关系,人们甚至可以通过搜集视皮层的fMRI信号来重建人眼看到的文字/图象,即所谓Mind Reading.

2.视觉皮层的分级结构和并行结构:

        视觉信号传递到V1之后,会继续向更高级的视觉皮层传递,最早在根据猕猴(Macaque Monkey)视皮层的解剖结果,人们重建了其各个视皮层之间的分级结构,以此为基础,逐渐理解了人的视皮层分级结构。

        从初级到更高级的视觉皮层,视觉信息逐级传递。人脑理解的内容越来越复杂化、抽象化,由“模式”变成具体的"物",再到物的特性和物与物之间的关系。在逐级传到过程中,人们也注意到,其在皮层的传到可以大体分成两个通路,腹侧通路(Ventral Pathway/Stream)和背侧通路(Dorsal Pathway/Stream)。分别又按照功能,被称作“What”和“Where”通路:其中“Where”跟物体的位置和运动处理有关,“When”跟物体的识别有关。

3.识别与跟踪:

        通过以上对分级结构的了解可以理解,在分级结构中任何一个区域的功能受损,都会影响人脑对运动的识别和跟踪,各种研究也证实了这一点。人对运动的感知和理解,并不是局限在某一个脑区或者几个脑区,而是全脑参与的活动。人脑在运动处理上,除了有被动的运动感知,还有主动的运动追踪,即凝视(共轭凝视,conjugate gaze)能力。

人有四个系统处理共轭凝视:

1、扫视系统(saccadic system),最常调用的系统,在人主动的调整凝视方向时使用;

2、追踪系统(pursuit system),追踪运动物体;

3、视动反射系统(Optokinetic reflex system),物体出现在视野,眼睛会追踪,当物体消失,人眼会反射性的回到凝视物体首次出现的位置;

4、前庭-眼 反射系统(Vestibulo–ocular reflex system),协调头部的运动以获得稳定的图像,是眼睛的“三轴稳定平台”。

    因而人眼就像一台高灵敏度、快速聚焦、快速响应、三轴稳定的摄像机,目前人类还造不出在对焦能力上足以和人眼比肩的摄像机,更别说做到跟眼睛同等体积了。人脑在运动识别及追踪处理上,目前区别于计算机运动识别追踪的重要一点是,人脑的识别追踪是实时的,并能反馈控制眼睛的主动追逐。在该机制下,通过“where”和“what”通路处理的信息,会传递到额叶眼领域(FEF, Frontal eye fields)等眼动控制中心,作出眼球运动响应。

该机制因此有如下优点:

        能永远让目标处在清晰度最高的视野中间和聚焦点一次识别和追踪失败,可以回来再看根据物体之间的相对运动区分物体能跟记忆关联,帮助物体识别和追踪运动预判在目前没有能力如此强大的摄像机机的背景下,目前做的计算机运动识别追踪主要是基于被动影像的处理,即不会根据处理结果调整聚焦和镜头方向。在该条件下,对追逐算法引入学习能力,仍然可以大幅提高追踪速度和准确性,如Tracking-Learning-Detection 方法:在图象理解方面,人脑的图像理解既有 bottom-up机制,又有top-down机制,两种相互助益。在图象模态方面,可以多模态结合,弥补摄像头没有回看能力的缺陷。在计算方面,分布式计算以提高实时性。如果能将计算结果反馈给摄像头控制,可能大有帮助。

总结:

        大脑视觉识别系统,是目前科学技术无法模拟的。视觉是通过视觉系统的外周感觉器官(眼)接受外界环境中一定频率范围内的电磁波刺激,经中枢有关部分进行编码加工和分析后获得的主观感觉,指物体的影像刺激视网膜所产生的感觉。

生理视力复健:

        视觉产生于眼外物象刺激。这一简单的道理指导我们激活视觉系统,必须眼外刺激,也称之源头输入刺激,激活大脑神经改善视觉。但是输入方法必须符合眼球生理属性,激活神经系统对应大脑各个区域处理整合优化脑内视力。


  • 上一篇:研究方向-视知觉脑机制和视觉再生与重塑
  • 下一篇:目前遮盖(眼科)
  • 招商加盟
    加盟优势
    签约流程
    成功案例
    成功案例
    店面风采
    联系我们
    地址:河北省承德市双滦区宝鼎花园2期16栋103号底商(三小门口东侧)亮目视光
    服务中心:18661249978
    联系人:赵总

    扫一扫 关注我们
    CopyRight © 2019 承德亮眼睛生物科技有限公司 All Rights Reserved   备案号: 京ICP备19013379号
    【招商加盟】 | 【联系我们】