我們長久以來一直有一個蠻困擾的事情,就是 Visual Studio 2022 在存檔的時候,他不一定會將程式碼自動儲存成 UTF-8 編碼,若以 Big5
編碼來儲存文字檔案時,在其他程式讀取時就有可能出現異常。例如我們的程式碼都會需要 git push 到 Azure DevOps 的 Repos 中,若程式檔的編碼為 Big5
的時候,這些中文字在 Azure DevOps 上面都無法正常顯示,也就是我在 Code Review 時看到的都會是亂碼,真的是不勝其擾。這篇文章我就來告訴你怎樣解決!
... 繼續閱讀 ...
我最近在整理《重編國語辭典修訂本》最新版的資料檔,因為我預計輸出成跟 g0v 的 moedict-data 專案相容的 JSON 格式,而在輸出的時候卻發現這些中文字都被編碼了,但我希望能夠輸出成完整的 Unicode 字元。這才發現即便是 .NET 8 最新版,也無法輸出完整的 Unicode 字元,這篇文章就是記錄我如何解決這個問題的過程。
... 繼續閱讀 ...
我們公司這幾年由於專案大多都是前後端分離的架構,所以很少用 ASP.NET Core MVC 來開發網站,但最近公司有個專案用到 ASP.NET Core MVC 框架,看到了一段 Code 覺得很陌生,所以就研究了一下,這才發現 ASP.NET Core MVC 在處理 HtmlEncode 的時候,預設的編碼範圍跟 ASP.NET MVC 有些不同,這篇文章就來記錄一下這些技術細節。
... 繼續閱讀 ...
昨天在授課的時候,由於課堂上提供給學員的壓縮檔案中目錄名稱與檔案名稱有中文字的關係,導致全班有 3 位學員解壓縮之後這些目錄與檔案全部呈現亂碼,無法開啟與閱讀。經過一番研究之後發現,原來 7-Zip 在壓縮檔案的時候,預設會將檔名編碼為本機電腦系統設定的 Code Page,而不是使用 UTF-8 編碼,這會導致解壓縮的人只要不是用相同的 Code Page 設定,就會解壓縮失敗,檔名出現亂碼。本篇文章就來說說這個問題的始末與解決方案!
... 繼續閱讀 ...
這陣子花了一些時間研究 Unicode 萬國碼,看著看著就研究起 Emoji 表情圖示來了。過程中還跑去看了 Unicode® Emoji 官方規格,要是沒有先建立對 Unicode 的理解,要完全看懂 Emoji 的來龍去脈是不太容易的。研究的過程中,還發現了一些有趣的冷知識,欲知詳情請繼續看下去! 😉
... 繼續閱讀 ...
最近有個案子需要設法過濾表單中輸入的文字,有些欄位只能輸入英數字,有些則必須自動轉全形文字,還有些只能輸入中文,有些不允許輸入標點符號。這個需求照理說很簡單,透過 Regular Expression 一下子就可以達陣,但是光是完成這功能實在太無趣了,所以晚上徹底的研究並整理所有的 Unicode 編碼,發現許多有趣的冷知識。
... 繼續閱讀 ...
各位在噗浪上或 MSN 聯絡人清單上經常都會看到一些人在命名時會用一些非常特殊的字元,例如用圈圈框起來的數字 ➀ ➁ ➂ 或 ✓ ✗ ✫ © ® 或貨幣符號 € £ ¥ ¢ ƒ 或是 {。^◕‿◕^。} 等俏皮的符號,這些特殊符號其實都是 Unicode 的標準字成員之一,如果你知道這些 Unicode 字元的編碼的話,你還能透過 Windows 內建的【 Alt + 數字鍵 】直接打出來喔,其實你現在就可以試試按著 Alt 鍵不放然後在輸入數字鍵的 10112 然後再將 Alt 鍵放開,看會不會看到 ➀ 被打出來呢!
... 繼續閱讀 ...