關於 EXCEL 內的浮點數儲存內容

October 6, 2021 One-minute read

問題重現 Link to heading

然後改用 C# 利用 Microsoft.Office.Interop.Excel 跟 ExcelDataReader 解析出來卻是正確的 0.0004。

原以為是 excelize 的 bug，於透過解壓縮 *.xlsx 的方式找到 \xl\worksheets\sheet1.xml 發現裡面真的是存 4.0000000000000002E-4 😵

0.0004 Most accurate representation = 4.00000000000000019168694409544E-4

目前測試的結果看起來 Excel 會依照小數點位數採取不同方式來記錄數字(原因不明)

1 位：直接存
2 位(不知道為什麼有這兩種差異)：
- $0.07 = 7.0000000000000007\mathrm{E}{-2}$
- 其他則直接用浮點換算的 0.XXXXXXXXXXXXXXXXXX(共18位) 紀錄。
超過 2 位：以科學符號紀錄浮點換算的值，並保留 17 個數字，然後第 18 個數字四捨五入。

所以原本的問題

$$ 0.0004 \approx 4.00000000000000019168694409544\mathrm{E}{-4} \approx 4.0000000000000002\mathrm{E}{-4} $$

參考 Read Excel File in C# 使用 Microsoft.Office.Interop.Excel 抓的 Value2 型態是 Double 所以轉換出的結果就是畫面上看到的那樣。
對於 Office Open XML 有興趣可以參考這幾篇：
安裝 ExcelDataReader 記得也安裝 ExcelDataReader.DataSet 不然沒法使用範例的 var result = reader.AsDataSet();。
找到這篇 Excel 技巧整理，雖然現在工作不太接觸 Excel 但還是有備無患。
也找到微軟官方提供的 Office 產品疑難排解。