فنون یو ایکس رایتینگ

علائم و نویسه فارسی بر اساس یونیکد استاندارد برای نویسندگان، تجربه‌نویسان و طراحان

نویسه فارسی - یونیکد فارسی - عربی - انگلیسی
مخاطب این مقاله:
تجربه‌نویسان، نویسندگان و طراحان
چرا بخوانیم؟
برای اصلاح نوشتار و درست‌نویسی

یکی از ایرادهای رایج در نوشته‌ها وب (از جمله متن تجربه کاربر محصولات دیجیتال، وب‌نوشته‌ها، پیامک‌ها و…) به کار بردن نویسه (Character) انگلیسی یا عربی به‌جای نویسه فارسی‌ست. در این نوشته اعداد و برخی حروف و علائم را با ذکر Unicode هر کدام مرور می‌کنیم و راهی نشان‌تان می‌دهیم تا بتوانید هر چیزی را درست به کار ببرید.

اعداد فارسی

قبل از هر چیز خوب است شکل اعداد عربی، فارسی و انگلیسی را مقایسه کنیم:

مقایسه صورت نوشتاری اعداد فارسی، عربی و انگلیسی - نویسه‌های فارسی

بسیاری از افراد گمان می‌کنند تفاوتِ بین اعداد فارسی، عربی و فارسی در نوع قلم (Font) یا تنظیمات سیستم است. صدالبته که اینطور نیست.

هر نویسه‌ای اعم از اعداد و حروف، یک یونیکد (Unicode) منحصربه‌فرد دارد. یونیکدها استانداردهایی جهانی‌اند و برای خطوط مختلف (مثل خط انگلیسی، خط عربی، خط چینی و…) تعیین شده‌اند. یونیکد نویسه‌های فارسی هم تابعی از خط عربی‌ست چون خطِ ما برگرفته از خطِ عربی‌ست.

یونیکد Unicode چیست؟

یونی‌کُد (به انگلیسی: Unicode) یک کدبندی نویسه و نمایش و پردازش متن به اکثر زبان‌های دنیا است. هر زبان یک قالب یونی‌کد دارد.

این استاندارد هماهنگ با مجموعه جهانی نویسه‌ها تألیف شده‌است و به صورت کتابی به نام ‘The Unicode Standard’ منتشر شده‌است. آخرین ویرایش این استاندارد شامل بیش از ۱۱۰٬۰۰۰ نویسه و ۱۰۰ نماد، مجموعه‌ای از نمودارهای کد برای مرجع تصویری، روش رمزگذاری و مجموعه‌ای از استاندارد رمزگذاری کاراکتر، شمارش خواص شخصیت مانند حروف بزرگ و کوچک، مجموعه‌ای از مرجع فایل‌های داده‌های کامپیوتر و تعدادی موارد مربوط مانند جزئیات نویسه، برابری یونی کد، رندر کردن، نظم و صفحه نمایش دو جهته (برای نمایش صحیح متن حاوی اسکریپت راست به چپ مانند عربی، فارسی و عبری، و اسکریپت‌های سمت چپ به راست) می‌باشد. تا تاریخ مارس ۲۰۱۹، آخرین ویرایش، یونیکد ۱۲٫۰ است.

ویکی‌پدیا

فونت یا صفحه کلیدم را عوض کنم درست می‌شود؟

در ادامه خواهیم دید که یونکید اعدادِ فارسی، انگلسی و عربی با هم متفاوت هستند. به همین دلیل، این باور که تغییر فونت باعث فارسی‌شدن اعداد می‌شود اشتباه است.

برخی از قلم‌های امروزی یک نسخۀ FuNm دارند. طراح این نسخه از قلم‌ها، یونیکد انگلیسی یا عربی شما را به‌طور خودکار به یونیکد فارسی تبدیل و در نتیجه نویسه‌ها را اصلاح می‌کند.

بنابراین شما با تغییرِ فونت یا تنظیماتِ نمایشِ فونت (در نرم‌افزارهایی مثل word) گمان می‌کنید نویسه‌های اعداد فارسی شده‌اند، امّا با تغییر قلم یا باز کردن فایل در یک محیطِ بدون تنظیمات (مثل یک ویرایشگر ساده یا یک کامپیوتر دیگر) متوجه غیرفارسی بودن اعدادتان می‌شوید.

استفاده از سری FuNm علاوه بر اینکه روشی فرعی‌ست، بارگذاری صفحات را به‌دلیل فراخوانی فونت‌های اضافه بیشتر می‌کند. البته استفاده از این سری در برخی مواردِ خاص مفید است.

نویسه اعداد فارسی + یونیکد

نویسه عدد صحیح فارسییونیکد Unicode
۰U+06F0
۱U+06F1
۲U+06F2
۳U+06F3
۴U+06F4
۵U+06F5
۶U+06F6
۷U+06F7
۸U+06F8
۹U+06F9
برای درج صحیح نویسه‌های فارسی، ذات یونیکد نویسه‌های شما باید فارسی باشد. یونیکد اعداد فارسی معمولاً با نامِ EXTENDED ARABIC-INDIC DIGIT شناخته می‌شوند.

نویسه اعداد عربی + یونیکد

برای آنکه متوجه تفاوت بین یونیکد نویسه اعداد فارسی و عربی بشوید، یونیکدهای عربی را هم در ادامه آورده‌ام:

نویسه عدد عربییونیکد Unicode
صفر عربیU+0660
یک عربیU+0661
دو عربیU+0662
سه عربیU+0663
چهار عربیU+0664
پنج عربیU+0665
شش عربیU+0666
هفت عربیU+0667
هشت عربیU+0668
نُه عربیU+0669
همانطور که می‌بینید یونیکد اعداد عربی به کل با فارسی متفاوت است.

نویسه اعداد انگلیسی + یونیکد

و در پایان می‌توانید تفاوت دو زبان فارسی و عربی با یونیکد اعداد انگلیسی را ببینید:

نویسه عدد انگلیسییونیکد Unicode
صفر انگلیسیU+0030
یک انگلیسیU+0031
دو انگلیسیU+0032
سه انگلیسیU+0033
چهار انگلیسیU+0034
پنج انگلیسیU+0035
شش انگلیسیU+0036
هفت انگلیسیU+0037
هشت انگلیسیU+0038
نُه انگلیسیU+0039

تفاوت چند نویسۀ عربی و فارسی

بسیاری از افراد بی‌آنکه مطلع باشند، برای نوشته‌های روزمرۀ فارسی از صفحه کلیدهایی که ذات عربی دارند استفاده می‌کنند. این موضوع باعث می‌شود نویسه‌هایی مثل ک و ی فارسی به‌اشتباه عربی نوشته شوند.

تفاوت‌شان را در این تصویر نشان داده‌ام:

تفاوت نویسه فارسی و عربی - ی فارسی و عربی
اگر نویسۀ ي و ك عربی چسبان باشد، معمولاً متوجه عربی بودنش نمی‌شویم.

نویسۀ سریا

سریا (ی کوچک روی ه) است که برخی به اشتباه آن را همزه یا ۶ کوچولو می‌نامند. در فونت‌های معتبر فارسی، (مثل فونت همین وب‌سایت) می‌توانید شکل کوچک‌شدۀ ی را روی ه ببینید: همۀ ما.

یونیکد اختصاصی این نویسه: U+06C0 است و معمولاً به این نام خوانده می‌شود: Arabic Letter Heh with Yeh Above.

قرار دادن همزه روی ه در زبان عربی هیچ معنا و وجهی ندارد. هیچ عرب‌زبانی روی ه همزه نمی‌گذارد چون این کار بی‌معناست. استفاده از همزه روی ه (کاراکتر ه+کاراکتر همزه) شامل دو کاراکتر است و استاندارد نیست. سریاء با یونیکد U+06C0 یک نویسه محسوب می‌شود و دو کاراکتر نیست.

تفاوت سریاء با ه همزه‌دار را ببینید:

شیوۀ شهرآشوبی / شیوهٔ شهرآشوبی

اگر صفحه کلید شما توانایی نوشتن نویسه‌های استاندارد فارسی را نداشته باشد، نمی‌توانید از سریاء استفاده کنید.

اشتباه‌های رایج در نویسه علائم

بسیاری از افراد تصوّر می‌کنند علائم جداکنندۀ هزارها، تاریخ و اعشار یکسان (/) هستند. آیا اینطور است؟

نویسه فارسیصورت نویسهیونیکد نویسه
جداکنندۀ هزارها (مثال: ۱۲٬۰۰۰ تومان)٬U+066C
جداکنندۀ تاریخ (مثال: ۰۱؍۰۱؍۱۴۰۰)؍U+060D
علامت اعشار (مثال: ۵۰٫۵)٫U+066B

علامت درصد

نویسه فارسی ٪U+066Aنویسه انگلیسی %U+0025

چطور از صورت درست نویسه‌های فارسی استفاده کنیم؟

برای نوشتن صحیح نویسه‌های فارسی در کامپیوتر و موبایل می‌توانید از نرم‌افزارهای مناسب‌سازی‌شده یا تخصصی کمک بگیرید.

قلم برتر یکی از این نرم‌افزارهاست که هم در ویندوز و هم در مک کاربرد دارد. می‌توانید بر پایۀ یونیکدهای استاندارد صفحه کلیدتان را آرایش کنید و نویسه‌های استاندارد را انتخاب کنید. تا جایی که من خبر دارم متأسفانه لینوکس یونیکد سریاء را نمی‌شناسد.

در موبایل‌های اندرویدی یا آیفون می‌توانید از کیبورد گوگل (Gboard) استفاده کنید که کامل و جامع است.

اگر از کیبورد استاندارد فارسی استفاده می‌کنید، احتمالاً به بسیاری از نویسه‌های فارسی دسترسی دارید، ولی برخی از نویسه‌ها (از جمله ۀ) را هم در اختیار ندارید. به هر روی اگر کیبورد استاندارد فارسی مبنای کار شماست، به‌کمک سند معرفی کیبورد استاندارد می‌توانید جای درست هر نویسه، حرف، عدد و علامت را تشخیص دهید و از اشتباه‌های رایج پرهیز کنید.

از خوبی‌های نرم‌افزار قلم برتر این است که شما می‌توانید همزمان نویسه‌های متنوعی از فارسی، عربی و انگلیسی در اختیار داشته باشید و متناسب با نیازتان از آن‌ها استفاده کنید.

امّا اگر روی استفاده از صفحه کلید استاندارد فارسی اصرار دارید، این کتابچۀ مختصر راهنمای شماست:

راهنمای چینش حروف و علائم در صفحه کلید استاندارد فارسی

چینش حروف و علائم فارسی بر صفحه کلید استاندارد (مطابق یونیکد)

این راهنمای کوتاه به شما کمک می‌کند نویسه‌های فارسی را درست و مطابق یونیکد استاندارد بنویسید. دانلود راهنما.

هم‌رسانی
نویسنده و تجربه‌نویس
نویسنده و تجربه‌نویس
داستان‌نویسی که با تجربه‌نویسی گذران می‌کند. من برای هموارکردن مسیر تجربه کاربران می‌نویسم. برای یوایکس رایتر شدن، مهارت نویسندگی کافی نیست. اینجا جهانِ طراحی‌ برای انسان است.
راه‌های ارتباطی:
برچسب‌ها:
درست‌نویسی
دیدگاه ها
سلطان آبادیان
3 سال

مفید و مختصر !
ممنونم

مجید
2 سال

سلام من در خیلی از نرم افزار ها و بازی ها دیدم که از زبان عربی هم پشتیبانی می کنند اما من وقتی می خوام فایل زبان عربی رو به فارسی برگردونم با اینکه هر دو زبان حروفش تقریبا یکیه و از یه سمت هم نوشته میشه اما اون نرم افزار یا بازی حروف عربی رو درست نمایش می ده اما فارسی رو کامل خراب می کنه نظر شما برای حل این مشکل چیه ؟؟ لطفا اگه برای این مشکل راه حلی هست برام ایمیل کنین … تشکر

    سلام
    وقت شما به‌خیر
    ممکن است یونیکد نوشتۀ شما با نوشتۀ نرم‌افزار تفاوت داشته باشد. معمولاً نوشته‌ها بر پایۀ یونیکد UTF-8 هستند.

شما بگویید

همرسانی