Ang Toshiba Corporation ay bumuo ng isang AI na may pagkilala sa 3D na may kakayahang sukatin ang distansya sa kawastuhan ng isang stereo camera, sa pamamagitan ng paggamit ng imaheng kinunan gamit ang isang komersyal na kamera at pag-aralan ang paglabo ng imahe na dulot ng lens ng camera gamit ang malalim na pag-aaral. Aalisin ng teknolohiyang ito ang paggamit ng mga stereo camera na kalaunan ay binabawasan ang gastos at espasyo. Ipapakita ng Toshiba ang nakamit na ito sa international conference sa computer vision (ICCV2019) na gaganapin sa South Korea sa Oktubre 30, 2019, mula 10 ng umaga.
Ang pag-sensing ng imahe ay nagiging mas mahalaga at ang mga aplikasyon tulad ng mga robot na gumagalaw ng mga bagay, mga autonomous na walang sasakyan na sasakyan, mga remote-control drone na nagsisiyasat ng mga imprastraktura atbp, nangangailangan ng higit pa sa mga imahe ng mga paksa, kailangan nila ng isang maliit na aparato upang pag- aralan ang 3D data upang isama ang hugis at distansya. Samakatuwid ang mga pagsasaliksik ay nadagdagan upang makabuo ng isang teknolohiya ng pagsukat na may mga monocular camera (madali silang gawing miniaturize) sa pamamagitan ng paggamit ng malalim na pag-aaral para sa mas mahusay na pag-aaral ng hugis, background, at iba pang data ng senaryo ng imaging bagay.
Ang pamamaraang ito ay nagtataglay ng isang sagabal; ang kawastuhan ng distansya ay tinatayang sa tulong ng isang monocular camera depende sa natutunan na data ng tanawin na nagiging sanhi ng isang drop ng kawastuhan dahil sa mga kuha na kuha sa iba't ibang mga landscape. Upang mapagtagumpayan ito Toshiba ay nakabuo ng kulay na nai-filter na aperture photography kung saan ang dalawang filter ng kulay ay nakakabit sa lens at ang kulay at laki ng nagresultang lumabo ng imahe ay pinag-aaralan ayon sa distansya mula sa paksa. Bagaman malulutas nito ang isyu ng pagpapakandili ng data, nagkakahalaga ito ng oras at pera upang mabago ang mga mayroon nang lente.
Napagtagumpayan ng Toshiba ang problemang ito sa pamamagitan ng pagbuo ng AI gamit ang teknolohiyang pagkilala sa 3D na gumagamit ng malalim na pag-aaral upang pag-aralan kung paano malabo ang imahe ayon sa posisyon nito sa lens, upang makamit ang pagsukat ng distansya na may parehong mataas na katumpakan tulad ng isang stereo camera system, na may isang normal na monocular camera ngunit nang walang anumang pangangailangan para sa data ng telon. Hanggang ngayon, ito ay itinuturing na imposibleng teoretikal na sukatin ang distansya batay sa hugis ng lumabo, na pareho para sa mga bagay na may parehong distansya at malayo kapag sila ay equidistant mula sa focal point. Ngunit, ang mga resulta na pansaliksik ay nagpakita ng malaking pagkakaiba sa pagitan ng mga hugis na lumabo malapit at malayo sa mga bagay, kahit na ang mga ito ay equidistant mula sa focal point. Sa pamamagitan ng iyon matagumpay na sinuri ni Toshiba ang blur data mula sa mga nakunan ng mga imahe ng isang malalim na module ng pag-aaral na sinanay na may malalim na modelo ng neural network.
Kapag ang ilaw ay dumaan sa lente ang hugis ng nilikha na lumabo ay nalalaman na magbago depende sa haba ng daluyong ng ilaw at ang posisyon nito sa lens. Sa nabuong network, ang posisyon at kulay ay pinoproseso nang magkahiwalay upang maayos na mapagtanto ang mga pagbabago sa hugis na lumabo, at pagkatapos, pagkatapos dumaan sa isang may timbang na mekanismo ng pansin, upang makontrol kung saan sa liwanag na gradient upang ituon upang wastong masukat ang distansya. Sa pamamagitan ng pag-aaral, na-update ang network upang mabawasan ang isang error sa pagitan ng sinusukat na distansya at aktwal na distansya. Gamit ang module na AI, nakumpirma ng Toshiba na ang isang solong imahe na nakunan gamit ang isang magagamit na kamera na kamera ay napagtanto ang parehong katumpakan ng pagsukat ng distansya na na-secure sa mga stereo camera. Ang karagdagang impormasyon ay matatagpuan sa opisyal na pahinang ito ng Toshiba.
Kukumpirmahin ng Toshiba ang kagalingan ng maraming sistema sa mga magagamit na mga camera at lente na magagamit sa komersyo at mapabilis ang pagproseso ng imahe, na naglalayon para sa publiko na pagpapatupad sa piskal na taon 2020.