دسته‌ها
برنامه نویسی

انکدینگ کاراکتر

هر کاراکتری با یک عدد که کد آن نامیده می‌شود در کامپیوتر ذخیره می‌شود. لیست کاراکترها و کدهای مربوطه را انکدینگ می‌گویند. برای اینکار استانداردهای مختلفی وجود دارد.

معروف‌ترین انکدینگ استاندارد UTF-8 است. که همه جا قابل استفاده است. اما فایل ها متنی فارسی در ویندوز با انکدینگ windows-1256 ذخیره می شود که در سیستم عامل های دیگر مثل لینوکس و مک او اس ممکن است درست نمایش داده نشود. مثلا فایل های زیرنویس فارسی که در ویندوز تهیه شده در سیستم عامل های دیگر قابل استفاده نیست. برای حل این مشکل برنامه قدرتمندی در لینوکس وجود دارد که می تواند هر انکدینگی را به هر انکدینگ دیگر تبدیل کند. نام این برنامه iconv می باشد.

برنامه iconv یک فایل متنی را دریافت می کند و آن را به انکدینگ دلخواه شما تغییر داده و نتیجه را به خروجی استاندار می فرستد. که البته شما می توانید مسیر آن را به فایل مورد نظرتان تغییر دهید.

به عنوان مثال اگر نام فایل مورد نظرتان file.txt باشد و نام فایل اصلاح شده file-utf8.txt دستور به شکل زیر می باشد.

iconv -f windows-1256 -t UTF-8 file.txt > file-utf8.txt