2006-05-17 19:41:13鼴鼠
不當使用SSE2指令會造成軟體performance drop?
最近在追一個新chip performance drop的問題,
使用vTune分析之後,發現幾個hot spot,
其中有一個函數是使用SSE2來做culling的運算,
基本上是一個陣列的加法,vTune1報告其中的pslld指令異常的緩慢,
因此鼴鼠改用FPU的版本來做運算,結果....
速度爆增?!
真是讓人意外的結果=_=
還需要詳察來驗證鼴鼠的理論才行....
使用vTune分析之後,發現幾個hot spot,
其中有一個函數是使用SSE2來做culling的運算,
基本上是一個陣列的加法,vTune1報告其中的pslld指令異常的緩慢,
因此鼴鼠改用FPU的版本來做運算,結果....
速度爆增?!
真是讓人意外的結果=_=
還需要詳察來驗證鼴鼠的理論才行....