• PowerVR簡史 (The Chronicles of PowerVR)

    PowerVR簡史

    文/Sobereva  寫于約2007年8月


    英國公司Videologic最初創立了PowerVR,PowerVR第一代分PCX1和PCX2兩種,PCX1采用0.5微米,PCX2采用0.35微米,二者皆為PCI卡,僅限于3D功能,類似voodoo1/2,但不需要外置連接線而是通過PCI總線傳輸數據,顯存64bit,8MB,核心同顯存運行頻率約60-66Mhz,單渲染管線單周期單紋理。PCX1采用了TBR技術,這是PowerVR系列芯片的技術中的一大重要特點,全稱Tile Based Deferred Rendering。雖然PowerVR不是第一個采用這種渲染方式的公司,但卻是將這種渲染方式成功應用于實際的市場產品上的公司。

    眾所周知傳統早期3D顯示芯片處理過程是先進行幾何運算,然后讀取、生成紋理等操作,然后通過深度測試決定像素是否可見,之后將可見像素進行必要的處理后輸出到Framebuffer(幀緩存)顯存上,之后由RAMDAC讀取顯存經過數模轉換輸出到顯示器上。這個過程中有一大缺點就是無論像素是否可見,都必須經過渲染,這將浪費大量填充率和帶寬,這被稱為overdraw。

    為了解決這一矛盾,PowerVR的TBR在幾何運算后,將屏幕的像素分成了很多矩形小塊,先經過每個小塊的深度測試,測試小塊是否可見決定小塊中的像素是否應當被渲染,之后將需要被渲染的再交給渲染管線去處理,之后輸出。這樣一來,不可見的像素已經提前被剔去不用被渲染,很大程度上節省了帶寬,減少了渲染管線的壓力。

    然而這一技術并非完美無缺,在經過小塊的深度測試的過程中需要一定時間,尤其對于比較多的碎小密集的多邊形的時候這更為明顯,在PCX1/2當中這一過程需要CPU的處理,因此加重了對CPU能力的需求,PCX至少需求MMX 166才能發揮功效。此外一些涉及到Z-buffer技術的程序在TBR的模式下往往運行有問題。是延續傳統渲染模式,加大帶寬和填充率來彌補這一問題,或是采用TBR技術,二者孰優孰劣這對并無絕對定論。nVidia一直沿用傳統模式,芯片設計以更多的渲染管線、更高的頻率、更高規格的顯存來解決問題。后來ATI也拿出了自己的解決辦法---Hyper-Z。

    PCX2的性能比PCX1有了一定提升,速度并不慢,可以在運行轉為它們優化的Quake2的時候效果很好,硬件指標上也勝過Voodoo,達到每秒120萬多邊形和6000萬像素的填充速度,在同時代產品中首屈一指。同時支持D3D、OpengGL,SGL,其中SGL是OpenGL的部分子集特為PowerVR進行了專有擴展。但是在實際使用中,由于驅動使兼容性較差,許多游戲運行有問題,并且對CPU要求較高(甚至不如更低平臺上voodoo的速度),導致銷售收了很大影響,但在Voodoo2之前的一段時間里市場占有率卻達到第二。

    PCX1芯片的產品中比較常見的是Apocalypse 3D和NEC PC 3DEngine,PCX2中比較有名的是Matrox在看到PCX2的優勢后而決定生產的唯一沒采用自己芯片的加速卡產品M3D。

    后來在1998年的3月的CeBit展覽Videologic拿出了ARC-1,但只是beta版,依然PCI接口,頻率66Mhz,依然僅有3D功能,貌似基于PCX2,據說創新和帝盟有意去生產此芯片的零售版顯卡。但是似乎后來沒了音訊。

    此后Videologic與Sega合作,為Sega的新游戲機設計圖形芯片,實際就是PowerVR二代,所對應的DC版核心是PVR250DC,桌面版產品叫做Neon250,采用它的Dreamcast于1998年2月推出。但是因此極大地導致了Neon250的PC桌面產品的延期,比預期Neon250發布時間晚了一年有余,比DC推出時間則晚了一年半。這是因為NEC更看重長期的訂單量大、市場穩固的游戲機圖形芯片的制造,游戲機一般3-5年更新換代一次,而風云多變的PC市場平均6個月為一周期,從長遠利益考慮,顯然NEC更愿意為了上百萬訂單的游戲機市場投入更多精力。這款芯片同時也有對應于Sega的街機NAOMI(NewArcadeOperationMachineIdea)的版本,相應的圖形核心名為CLX2,搭載16MB顯存,250萬多邊形每秒,5億像素每秒,這款街機板于1998年問世。而2000年問世的NAOMI2則搭配兩顆CLX2,搭配VideoLogic的ELEN芯片做為幾何變換和光影效果加速器,搭載32MB顯存,畫面效果相當不錯。

    1998年12月2日的COMDEX剛結束,NEC和Videologic宣布聯合推出Neon250,開始提供樣片,大家對這款產品十分有信心,對外公布多邊形處理速度500萬每秒,像素渲染速度2-5億每秒。雖然比DC版性能有所下降,但是其公布的資料在當時來說性能仍然是很有競爭力的。NEC產品銷售經理Charles Bellfield說“PowerVR 250令人難忘的性能表現超出了我們的預期”,同時還表達了Neon250的戰略意義“PowerVR 250標志著NEC/VideoLogic針對游戲市場的跨平臺戰略終于初具規模了,該戰略將使家用游戲機、個人電腦和街頭游戲機上的游戲軟件具有前所未有的可移植性,因而能夠通過大量銷售的硬件和軟件極大的降低硬件系統成本和游戲軟件價格”。一切看起來很美好,無論是性能還是戰略前景。然而此后Neon250卻遲遲沒有真正上市,直到1999年秋季Neon250才終于上市,芯片仍然由NEC制造,也稱PVR250,有AGP-2X和PCI接口兩種,而AGP版比PCI的速度僅快很少一點。核心和顯存都是125Mhz,采用SDRAM,64bit,32MB顯存,渲染管線仍然是1條,每條管線單紋理單元。擁有250Mhz RAMDAC,支持OpenGL、SGL、DirectX6。僅由Videologic制造過此芯片的顯卡。支持FSAA,不支持mipmap dithering,使用三線性過濾的時候不能像voodoo3/TNT2那樣通過mipmap dithering那樣來實現相同效果,所以只能用真正的三線性過濾很影響速度。因為發售時間極大地延遲,3dfx和nvidia的第四代產品已經上市了,加上它頻率低,所以其性能在當時來說比較慢,介于TNT-TNT2的程度,價格也不便宜,所以銷量很差,在歐洲市場相對于其它地方情況還算好一點,目前存世量頗小。雖然這款產品情況銷售十分糟糕,但是采用這款芯片的DC游戲機的情況卻挺不錯。

    值得一提的是從Neon250開始TBR渲染模式前期的深度測試功能不再需要CPU處理,而是集成于顯示芯片內部,分擔了CPU的負擔,以后PowerVR的顯示芯片設計亦是如此。

     

    VideoLogic后來變為聲、顯卡制造,從VideoLogic分出來的Imagination Technologies成為VideoLogic、PowerVR、Ensigma、Metagence這四者的母公司,其中Ensigma、Metagence是面向DSP設計。

     

    Imagination Technologies將PowerVR技術授權給了STMicroelectronics(意法半導體),稱為PowerVR三代的Kyro誕生,由PowerVR設計ST最終成型并且制造,此系列驅動一直由PowerVR開發。ST有自己的芯片生產廠,曾經nVidia的NV1、Riva128/ZX的芯片有很大部分就是由ST生產的。ST產的NV1叫做STG2000用于Diamond Edge 2120/2200,市場上很多riva128/ZX產品芯片上都有ST的Logo。

    Kyro采用0.25微米工藝,核心代號STG 4000X,0.12億晶體管,有PCI和AGP-4X版本,工程版核心、顯存皆115Mhz,最終出貨版提升到125Mhz核心,128bit 32/64MB SDRAM顯存,270Mhz RAMDAC,2*1管線架構即雙管線單紋理單元。支持DX6、EMBM(環境凹凸貼圖),不支持T&L,繼續采用TBR模式。

    Kyro的核心尺寸很小,同時發熱量也小,晶體管數量也明顯低于同期nVidia的產品,其目的在于降低生產成本,使晶圓能切割出更多的芯片,以性價比優勢來和其它產品競爭。其性能基本介于TNT2 Ultra與GF256 SDR版之間,一大特點就是32bit色相對于16bit色性能下降很小,在32bit色下甚至可勝于GF256 SDR。由于Kyro采用了塊狀渲染架構,所以進行高分辨率渲染之后輸出到低分辨率這樣方式的全屏抗鋸齒時可以避免大量高分辨率下不必要的像素渲染,所以打開全屏抗鋸齒時速度降低也比較小。產品基本還算成功,采用其芯片的有Inno3D KYRO 2000,VideoLogic Vivid!, 撼迅Evil Kyro,Hercules 3D Prophet 4000。不過驅動仍然不算很完善,有時會出現不兼容、死機的情況。

     

    僅僅過了幾個月,Kyro2推出,核心代號STG 4500,0.18微米,0.15億晶體管,核心、顯存頻率提升至175Mhz,仍然不支持T&L,依然是2*1管線,270Mhz RAMDAC,支持部分DX7功能,TBR模式。其內部接口為AGP-2X,但可通過硬改顯卡刷新BIOS支持AGP-4X模式。采用它的芯片的有Hercules 3D Prophet 4500、VideoLogic Vivid!XS。由于ST沒有0.18微米生產能力,所以芯片的生產交由TSMC(臺積電)。

    Kyro2在16bit色性能介于MX和GTS,32bit性能相對于16bit色依然下降很小,此時往往比GTS還好。整體來說比KYRO平均提升1/3以上,尤其在高分辨率在某些項目甚至提升可達將近1/2。在當時號稱MX400殺手,在歐洲市場較受歡迎,甚至據說比MX400銷售量還好一點,尤其Prophet 4500銷量頗大。此卡還支持渲染通道內最大8層紋理,對于多層貼圖的游戲中比較占優勢,比如SeriousSam部分場景采用多達5層貼圖。雖然和TNT2、Voodoo3一樣都是只有兩條紋理管線,每個周期只能處理兩個層紋理,但是面對多紋理時,TNT2、Voodoo3這樣傳統架構需要擁有至少同等數量的管線才能在一個周期內處理完這樣的多層紋理,若層數超過管線數量則只能占用更多周期處理完紋理之后再進行硬件混合,將會降低運行效率。而如果依靠增加紋理管線則會使芯片過于復雜。而對于Kyro2,會把紋理分成多進程處理,將已處理過的存入緩沖區中,然后再累加進行下一個紋理合成處理,這樣就減少了以往多個管線合成所占用的資源,對于提高性能和降低帶寬利用都是有好處的。只是在早期驅動只開放了4層,而發售時的驅動已經比較完善了,驅動控制面板功能豐富,甚至包括超頻選項,運行比較穩定,而且大多數不兼容的現象都可以通過驅動程序里面的選項設置進行解決。

    Kyro2存在的問題在于渲染管線明顯太少,2*1管線相對于當時GF2的4*2管線來說填充率嚴重受到限制,并且SDR顯存提供的顯存帶寬相對于已普遍使用的DDR在一定程度上限制了性能的發揮。

    隨后KyroII SE發布,核心代號STG 4800,相對于Kyro2變化的只有核心、顯存頻率提高到200Mhz,接口完整支持AGP-4X,其它部分保持不變。采用它的顯卡有Hercules 3D Prophet 4800、VideoLogic Vivid!XS Elite。

     

    此后PowerVR的第四代KyroIII開始研發,代號STG5000,但是一直沒有結果。PowerVR此后轉向掌上圖形市場并且取得很大成功,它們的顯示芯片PowerVR MBX授權給了Intel,0.13微米工藝誕生出來的就是眾所周知的2700G,代號Marathon,和PXA27x系列處理其搭配用于PPC,比如DELL X50/51v,其中2700G3/G5分別集成384/704KB顯存,可以在640*480下流暢運行Quake3。擁有83萬/秒多邊形及像素填充能力,支持全屏抗鋸齒和硬件T&L,擁有MPEG1/2/4解碼運算能力,功耗僅1mW左右,性能已經接近99年的臺式機圖形芯片。

    它們的新一代掌上圖形芯片PowerVR SGX510/520/530屬于第五代PowerVR產品,采用統一架構,支持DX9,SM3.0,OpenGL 2.0,依然采用TBR渲染模式,支持H264解碼,目前已經授權給NEC和Intel,作為Intel產品計劃命名為2900G。

     

    總體來說PowerVR是一家技術型公司,在當年顯示芯片紛爭的時候,曾有過多達150家以上公司研發顯示芯片市場,然而如今卻所剩寥寥無幾,顯示芯片更新周期短競爭激烈,不僅需要強大的研發能力,而且需要很好的市場運作。PowerVR規模和實力無法與nVIDIA、ATI相比,之所以能一直生存下來的原因是及時轉向適合自己發展方向的領域即移動市場,走精、專的路線,很好地發揮了自己的技術優勢,同時也避免了桌面圖形市場的殘酷競爭,我認為是非常明智的。

     

    昔日興盛的ATI消失了,在桌面圖形領域真正屹立不倒的只有nVIDIA。希望PowerVR公司能一直走下去,帶給大家更好的產品,推動科技的進步。希望PowerVR與Intel加強技術合作,不僅可以加快Intel集成圖形芯片的研發來面對ATI與AMD的聯手,同時亦可借規模雄厚的Intel之力有朝一日重回桌面圖形市場和nVIDIA一爭高下,再現輝煌,它們有技術,有能力,有機會,這相信會是無數PowerVR支持者的最大心愿!

     

    References

    [1]Mike Andrawes,Matthew Witheiler.AnandTech.2000:www.anandtech.com/showdoc.aspx?i=1253&p=5

    [2]Kristof Beets,Marco van Zuylen.Beyond3D.1999:www.beyond3d.com/reviews/videologic/neon250/index1.php

    [3]Dave "Wavey" Baumann.Beyond3D.2001:www.beyond3d.com/previews/videologic/vividxs

    [4]EX3D.隱藏的危險-Videologic PowerVR3—KYRO.微型計算機.2000年14期:7-10

    久久精品国产99久久香蕉