還記得我本月15日的日記嗎?本著對自己才疏學(xué)淺的不滿,我忍不住再次尋找Magic Leap的線索。
話說magic leap在公眾視野里消失的也太快了吧?youtube視頻點擊量直線下滑,從最開始100W+擊的掌中象、鯨魚和辦公室大戰(zhàn),到一個月前發(fā)布的星戰(zhàn)機器人賣萌demo(Lucasfilm幫忙做的特效咯),至今只有2W不到點擊量LOL。這就是老是畫大餅的后果嗎:)
所以說Mixed Reality科普任重而道遠,因為它如期將至。
如果MR設(shè)備的移動性和外表親和力都能得到普羅大眾的認可的話,應(yīng)用場景將會是整個世界!
但是目前看來,愿意相信和嘗鮮的,還是前2.2%的發(fā)燒友。瞧,用戶等級也是按鐘形曲線分布的。
今天收獲滿滿,可以說打心眼里接受了光場投影的設(shè)定:
僅作筆記,非商業(yè)用途。
第一篇是來自36Kr的:
Magic Leap不得不說的秘密 (2016-2-19)
這篇文章后半部分聚焦在人機交互的難點上。看了怎么多VR頭暈的解釋,我今天才第一次看懂:
Stereoscopic 3D是假3D
3D圖像比2D圖片多了一個維度,這個維度就是景深(depth),看過3D電影和2D電影的同學(xué)知道感官上有明顯的區(qū)別(只有少數(shù)人有雙盲癥不能看到)。大家知道人眼感知景深有很多機制,包括單眼(monocular)和雙眼(binocular)的。單眼能感知的景深信號很多,比如:一個東西遮擋了另一個(occlusion),熟悉的物體的大小(relative size/height),物體移動的變化(遠的物體變化慢近的物體變化快,即motion parallax)。在此基礎(chǔ)上,雙眼的景深信號也非常強烈(所以遠古的我們能更好地判斷對面的老虎或者鹿到底離多遠)。兩只眼睛看到同一個場景會有細微差別,這讓大腦能通過三角計算(triangulation)來得到物體景深。
Stereoscopic 3D就是利用這個原理給雙眼分別顯示不同的圖片(如下圖),它們很相似,只在水平方向上有細微差別。而這兩張圖片拍攝的時候,就是用兩個并排的相機模擬人眼的位置拍的,現(xiàn)在的3D電影都是基于這個原理。
Paste_Image.png
但這樣的Stereoscopic 3D有什么問題呢?簡單講它會引起用戶身體不適如頭暈、惡心等。為什么呢?這又涉及到人眼的一個有意思的機制。當(dāng)我們在看一個現(xiàn)實世界中的物體時,眼睛其實有兩種自然反應(yīng):
(1)聚焦(Accommodation/Focus)。眼睛的晶狀體就像一個凸透鏡,它會調(diào)節(jié)凸度來讓那個物體在咱們視網(wǎng)膜上清楚成像。
Magic Leap不得不說的秘密
(2) “會聚”(Convergence)。在每只眼睛聚焦的同時,兩只眼球還會有旋轉(zhuǎn)運動來一起指向那個物體。
Magic Leap不得不說的秘密
很自然地,這兩種反射運動在神經(jīng)上是聯(lián)接的(neurally coupled),也就是說任意一種運動會自動引發(fā)另一種運動。這也意味著,在人眼看真實物體的時候,聚焦和會聚的距離總是相等的(vergence distance = accommodation distance,參見下圖A)。
那么Stereoscopic 3D的問題就來了。因為Stereoscopic的投射距離總是固定的(也就是accommodation distance不變),而圖片的disparity會讓眼睛會聚在不同的距離(vergence distance)以產(chǎn)生景深3D效果(見下圖B)。所以,這兩種距離經(jīng)常是不一致的(vergence distance ≠ accommodation distance),會造成這兩種神經(jīng)相連的運動強行分離(neurally decoupled)。
從另一個角度講,在自然世界里,當(dāng)人眼聚焦并會聚到一個物體時,別的距離的物體應(yīng)該都是模糊的(下圖C)。而在Stereoscopic 3D里,不管人眼聚焦到哪兒,別的距離的物體成像都是清楚的(下圖D)。
這些都不符合自然界人眼的規(guī)律,因此大腦會產(chǎn)生混亂,長時間就會引起惡心暈眩等癥狀[4]。所以Stereoscopic其實是用了一個小伎倆讓人能看到3D效果,但它并不是真3D。
Paste_Image.png
光場(light field)是真3D
光場顯示跟Stereoscopic 3D比的一個很大不同就是它有本事能讓人眼聚焦到不同的距離,從而和會聚的距離保持一致。這是最符合人眼觀察自然世界規(guī)律的做法,因此被稱為true-3D。
可以想象要實現(xiàn)這樣的光場顯示,并不是那么簡單。現(xiàn)在主要是兩種方法:空間復(fù)用(space multiplexing)和時間復(fù)用(time multiplexing)。“空間復(fù)用”簡單說就是把一個像素當(dāng)幾塊用來實現(xiàn)不同的聚焦距離。Nvidia在SIGGRAPH上展示的那個原型就屬于這種。這個方法最大的問題就是分辨率大打折扣。我曾經(jīng)試戴過,基本就是霧里看花。
“時間復(fù)用”呢,就是用高速原件來快速產(chǎn)生不同的聚焦距離,讓人眼以為它們是同時產(chǎn)生的。這樣的好處就是分辨率不損失。大家知道人眼的速度感知是有限的,很多顯示器都是60Hz的,因為人眼能分辨的極限值一般就是60Hz(在某些高速內(nèi)容比如游戲里可能達到90-120Hz)。這意味著什么呢,如果利用高速顯示360Hz,就可以實現(xiàn)6個不同的聚焦距離。而有研究表明用6個聚焦距離加上一種線性混合(linear blending)的渲染算法就基本能實現(xiàn)從約30厘米到無窮遠讓人眼自然對焦[5]。
Magic Leap的技術(shù)是哪種呢?它最近demo用的哪種技術(shù)沒有公開,但很有可能還是基于Brian的高速激光光纖掃描(scanning fiber)技術(shù),也是一種時間復(fù)用的辦法。Brian當(dāng)年先試過只用一根光纖掃描不同聚焦距離,這樣做明顯對速度要求太高,后來用一個光纖束(fiber bundle/array),比如16根,每個光纖有一點位置差,然后同時掃描得到不同聚焦距離。
這樣的光場受現(xiàn)實系統(tǒng)的局限肯定不可能是連續(xù)的,都是被采樣的(downsampled)。但是,即使是這樣的光場投射到眼睛里也在理論上是跟真實世界物體光線進入眼睛是一個道理,因此可以實現(xiàn)true-3D。回到最初的問題,這也是為什么Magic Leap的技術(shù)重要的原因。現(xiàn)在你也理解了為什么Rony說“HoloLens會讓人惡心”了吧?
第二篇文章是來自公眾號“賽先生”的科普:
Magic Leap 核心技術(shù)揭秘--顧險峰老師 (2016-2-23)
這篇文章才是重中之重啊,讀完之后有種Magic Leap也終于走出了黑盒的感覺,棒!
相比之下,我的介紹連入門都不算啊:(。