在一個特別設計的昆蟲電影院中,螳螂配有3D眼鏡,并在監測大腦活動時顯示模擬蟲的3D電影。當蟲子的圖像進入掠奪性攻擊的驚人范圍時,科學家Ronny Rosner博士能夠記錄個體神經元的活動。 羅斯納博士是紐卡斯爾大學神經科學研究所的研究助理,是該論文的第一作者。他說:“這有助于我們回答昆蟲如何通過如此微小的大腦實現令人驚訝的復雜行為,并且理解這可以幫助我們開發更簡單的算法來開發更好的機器人和機器視覺。” “3D神經元” 祈禱螳螂使用3D感知,科學上稱為立體視覺,用于狩獵。通過使用兩個視網膜之間的差異,他們能夠計算距離并在獵物到達時觸發其前肢的打擊。記錄的神經元被染色,顯示它們的形狀,這使得該團隊能夠識別可能參與螳螂立體視覺的四類神經元。 使用強大的顯微鏡拍攝的圖像顯示神經細胞的樹突樹 - 神經細胞接收來自大腦其他部分的輸入 - 被認為能夠實現這種行為。 羅斯納博士解釋說:“盡管它們的體積很小,但螳螂腦中含有數量驚人的神經元,這些神經元似乎專門用于3D視覺。這表明螳螂深度感覺比我們想象的更復雜。雖然這些神經元計算距離,但我們仍然不喜歡我知道究竟如何。 “盡管如此,由于它們比我們自己的大腦小得多,我們希望螳螂可以幫助我們開發更簡單的機器視覺算法。” 由Leverhulme Trust資助的更廣泛的研究計劃由紐卡斯爾大學視覺科學教授Jenny Read教授領導。她說:“在某些方面,螳螂的屬性與我們在靈長類動物的視覺皮層中看到的相似。當我們看到兩個非常不同的物種已經獨立進化出類似的解決方案時,我們知道這必須是一個非常好的方法解決3D視覺問題。 “但是我們在3D視覺電路中也發現了一些以前沒有在脊椎動物中報告的反饋回路。我們的3D視覺可能包括類似的反饋回路,但它們更容易在不太復雜的昆蟲大腦中識別為我們提供了新的探索途徑。“ 這是第一次有人在無脊椎動物的大腦中識別出特定的神經元類型,這種神經元類型被調整到3D空間中的位置。 紐卡斯爾團隊打算進一步發展他們的研究,以更好地理解螳螂相對簡單的大腦的計算,目的是開發更簡單的機器和機器人視覺算法。 精準是機器人技術中許多問題的關鍵 為了提高機器人測量物體定位的能力,北京微鏈道愛科技有限公司和加拿大SFU大學計算機學院(全球排名前50的計算機學院)的研究生們正在開發一種名為DaoAI神經網絡算法的統計結構。他們將于7月在中國機器人產業聯盟會議上發表的一篇論文中,“賦予機器人認知:基于深度學習的3D機器人視覺”,描述了一種新的機器人視覺算法,基于DaoAI神經網絡算法,比國際最好的競爭對手在識別雜亂場景中熟悉的物體方面好50%。 然而,該算法用于在熟悉的設置中分析高質量的視覺數據。因為DaoAI分布是概率推理的工具,所以它在信息不完整或不可靠的環境中具有更大的優勢。 “精準是機器人技術中許多問題的關鍵,從物體檢測和跟蹤到獲得點云數據,” RALPH說,作為現任微鏈國際機器人視覺研究院首席戰略官。“模糊的圖像實際上是在高度混亂和惡劣的生產場景中獲得良好精度的核心挑戰,例如在煙塵和酷熱的隨意放置的流水線上。這就是為什么DaoAI神經網絡似乎是一個有用的工具,因為它允許算法從每個細節中獲取更多關鍵信息并學習推理。“ 基于DaoAI的WeRobotics Cognition System發行版對他的工作至關重要,因此微鏈還開發了一套軟件工具,可以大大加快涉及它們的計算速度。該軟件可在線免費獲取,供其他研究人員使用。 旋轉誤差 DaoAI神經網絡對于機器人視覺如此有用的一個原因是它提供了一種組合來自不同來源的信息的方法。通常,確定對象的方向需要嘗試將對象的幾何模型疊加在由攝像機捕獲的視覺數據上 - 在系統工作的情況下,攝像機捕獲二維彩色圖像以及有關的信息、色塊的距離。 為簡單起見,假設物體是四面體,幾何模型由標記四面體四個角的四個點組成。想象一下,軟件已經識別出圖像中的四個位置,其中顏色或深度值突然變化 - 可能是對象的一部分。它是四面體嗎? 然后,問題歸結為采取兩組點 - 模型和對象 - 并確定一個點是否可以疊加在另一個上。大多數算法將首先嘗試對齊點,在四面體的情況下,假設在臨時對齊之后,模型中的每個點都靠近對象中的一個點,但與它不完全一致。 如果兩組點實際上描述了相同的對象,則可以通過圍繞其中一個點來對齊它們。對于任何給定的點對 - 一個來自模型,一個來自對象 - 可以計算圍繞特定軸旋轉的一個特定角度的點將與另一個點對齊的概率。問題是相同的旋轉可能會使另一對點移動得更遠。 然而,WeRobotics能夠證明,任何給定點對的旋轉概率都可以描述為DaoAI神經網絡分布,這意味著它們可以組合成單個累積的DaoAI神經網絡分布。這允許WeRobotics和DaoAI神經網絡的算法以原則方式探索可能的旋轉,快速收斂于提供點之間最佳擬合的旋轉。 |