الف – خسته نباشی

نمی دانم اگر مرحوم ابوالقاسم فردوسی این صحنه را می دید چه حالی می شد!
با این زمزمه های سایتهای خبری و فرومهای قارچی معلوم نیست ۵۰ سال دیگر بتوانیم متون اصیل فارسی را بخوانیم.

غلطهای املایی رایج در اینترنت

این روزها توی هر سایت ریز و درشتی که سر بزنی تا دلت بخواد غلط املایی پیدا می کنی (البته بیشتر در مورد فرومها). غیر از سایتها برگه های امتحان رو که تصحیح می کنم باز هم شاهکارهای زیادی به چشم می خورد! من که خیلی غصه می خورم. کلماتی مثل سپاسگزار و درخواست را می نویسند سپاسگذار و درخاست! مطمئن رو می نویسند مطمعن! و بدتر از اون مطمئنا رو می نویسند مطمعنن! آدم می مونه که بخنده یا گریه کنه. اون یکی دیگه ادعای کتاب نوشتن داره: توی کتابش مرئی رو نوشته مرعی و اوج فاجعه آنجاست که افزودن رو نوشته افضودن. توی سایت خبری طرف نظر داده، کلی ابراز وجود کرده یه جوری که آدم احساس می کنه علامه دهره، بعد توی متنش نوشته مثلن تو همین ایران ما کسی حاظر نیست…(یعنی همون مثلا و حاضر) اگر اشتباه نکنم این مدلیش رو هم دیدم (مصلن).  امروز هم که توی یک سایت دیگری داشتم مطالعه می کردم دیدم گزاف رو نوشته گذاف. بامزه تر از همه اینها، روزی رفتم یه جایی! طرف دنبال پرونده ام می گشت، گفت فامیل شریفتون چی بود، گفتم خسروی. منشی بنده خدا هی گشت و پیدا نکرد. اخر سر خودم گشتم دیدم روی یک پرونده ای با خط نستعلیق نوشته شده آقای خصروی! گفتم شاید این باشه! طرف پیش منشی خودش کلی شرمنده شد!

نکنید این کارا رو! دودش توی چشم خودتون می ره.

از غلطهای املایی که بگذریم در صحبتها هم خیلیها نمی فهمند چه می گویند؛ مثالهای زیادی پیش آمده لیکن جای بیانش نیست. بهتره یه خاطره که دکتر انوشه نقل می کرد رو بگم و بحثم رو کوتاه کنم: دکتر انوشه می گفت، با همکارم (آقای دکتر) رفتیم عروسی یکی از دانشجویان وقتی رسیدیم خونه طرف، گفت: فریدون برو که تا گلو رفتی تو خرخره!

یک راهنمایی گرامری: کلماتی مثل سپاسگزار و قانونگذار را چگونه درست بنویسیم؟

هر گاه در معنی گذاشتن به معنی تعیین کردن یا گذاشتن بود باید گذار استفاده کنیم مثل قانونگذار یا تاثیرگذار و اگر به معنای به جا آوردن یا انجام دادن بود (گزاردن) از گزار استفاده می کنیم: مثل نمازگزار، سپاسگزار یا خدمتگزار

هر جا هم که کم آوردید از لغت نامه دهخدا کمک بگیرید.

از این فنگلیش هم که دل پری دارم که نپرس، خدا را شکر لااقل دانشجوهام (به خاطر جواب گرفتن ایمیلشان) فارسی ایمیل می زنند. شما هم سعی کنید به فارسی نوشتن عادت کنید یا اگر جگرش رو دارید انگلیسی خالص بنویسید! اونقدر تایپ فارسی رو قوی بشید که بدون صفحه کلید فارسی بتونید بنویسید مثل من!

فارسی را پاس بداریم

پنگلیش بنویس فارسی تحویل بگیر

شاید شما هم به سایتهایی برخورد کرده باشید که به شما امکان تبدیل فنگلیش به فارسی رو می دهند. به نظر من این سایتها کمک بزرگی در حق زبان فارسی می کنند که شاید از OCR فارسی هم مهمتر باشه! متاسفانه بسیاری از کاربران وب فارسی زبان به زبان مجعول پنگلیش (نوشتن فارسی با لغات انگلیسی) عادت کرده اند؛ زبانی بسیار مزخرف که خواندن آن برای من یکی که از خواندن خط میخی هم سخت تره! سایت بهنویس که امروز باهاش آشنا شدم به درد من نمی خوره چون خدا رو شکر صفحه کلید فارسی رو از بَـرَم حتی اگر برچسب فارسی نداشته باشه! ولی به درد دانشجوهام حتما می خوره چون ۹۹ درصدشون به طور غریزی فنگلیش کار می کنند؛ {البته با اصرار من این درصد به ۹۰ کاهش یافته و به زودی تک رقمی هم خواهد شد!}

در تصویر زیر نمونه ای از کار بهنویس رو مشاهده می کنید، واقعا الگوریتمش فوق العاده کار میکنه.

فارسی را پاس بداریم

هر چی برای این سایت تابناک نظر می‌دم که آقا تو رو خدا یه تغییری توی خودتون بدید، اصلا انگار نه انگار. کاف به این خوش تیپی «ک» رو که می‌نویسند «» که خیلی عربیه. «ی» به این خوشگلی رو ول کردن و جاش می‌نویسن «» که با اون دو نقطه‌ی زیرش حال آدم رو دگرگون می‌کنه. آخریش هم که واقعا آزار دهنده است نحوه‌ی نوشتن ارقام و ممیزها است. مثلا می‌خواد بنویسه ۱۱٫۵ میلیون تومان یه چیزی تو این مایه‌ها می‌نویسه که معلوم نیست ۵٫۱۱ یا ۱۱٫۵؛ به هر حال از این لحاظ خیلی سایت مزخرفیه. این اواخر یکبار از مردم خواست که مشکلات سایت رو بگن، شاید صد نفر همین موضوعات رو گفتند ولی انگار نه انگار. در عوض تا دلتون بخواد از سایت تبیان خوشم می‌یاد. تمام قواعد زبان رو رعایت می‌کنه، ضمن اینکه طراحی فوق‌العاده‌ای هم داره.

عزیزان دل برادر، فارسی را پاس بدارید.

پرشیانگار

دوستانی که دنبال یک OCR فارسی می‌گردید نگردید چرا که از سه حالت خارج نیست: یا گیر نمیاد یا گیر میاد ولی به درد نمی خوره، یا گیر میاد به درد هم می‌خوره ولی به درد مرفهین بی‌درد!

محصولات OCR فارسی که لااقل برای ما گیر نمیاد:

Verus از NovoDynamics با قیمت ۶۵۰۰ دلار ناقابل، Automatic Reader یا القاری العالی یا آنچه که در ایران به نام صخر می‌شناسیم به قیمت ناقابل ۴۵۰۰ دلار. یکی دو نرم افزار دیگه هم سالهاست که اسمشون هست ولی خبری ازشون نیست مثل OCR مدیانیک و OCR سپنتا.

محصولات OCR فارسی که گیر میاد ولی به درد نمی‌خوره:

ReadIris از Iris که نسخه‌ی کرک شده‌اش به ثمن بخس و به جای بلبل به فروش می‌رسد. دقت متوسط این نرم افزار چیزی حدود ۶۵% است که خیلی وقتها بهتر است دوباره تایپ کنیم! تا اینکه از خروجی این نرم افزار استفاده کنیم.

واژه شناس از شرکت هوش مصنوعی رایورز که این روزها همه‌ی مردم کوچه و بازار هم فهمیده‌اند که این همان Automatic Reader بدبخت است که توسط جماعت ایرانی هک شده و پس از فارسی سازی منوها به عنوان محصول یک شرکت با قیمت ۳۲۰ هزار تومان به فروش می‌رسد. خدا را شکر، نسخه‌ی هک شده‌اش هم کرک شده! و به راحتی در بازار یافت می‌شود‌.

خودنگار از پژوهشکده‌ی هوشمند علائم که به شکل عجیبی (بسته‌ی نرم‌افزاری آن یک OCR انگلیسی را نشان می‌دهد) و به قیمت ۲۰۰ هزارتومان عرضه می‌شود. اطلاعات چندانی از نسخه‌ی جدید این نرم افزار که سالهاست خبری از آن نیست، در دست نیست. لیکن اگر مثل نسخه‌ی قبلی اش باشد که خدا به خریدارش رحم کند.

محصولات OCR فارسی که گیر میاد به درد هم می‌خوره ولی به درد مرفهین بی‌درد:

در این زمینه تنها یک محصول هست که امکانات واقعا کاملی داره و لیکن پول واقعا کاملی هم باید بپردازید! نویسه خوان آراکس محصول شرکت هدی سیستم که به قیمت ۱۵۶۲۵۰۰ تومان (بله ۱٫۵ میلیون تومان)  به فروش می‌رسد.

واما پرشیانگار

تنها محصولی که هم گیر میاد، هم به درد می‌خوره و البته به درد شما (غیر مرفهین بادرد!) می‌خوره. یک OCR دقیق، سریع و زیبا مخصوص زبان فارسی. یکی دو روز دیگر تا پایان تخفیفات ویژه‌ی این نرم افزار باقی نمانده، اگر واقعا به دنبال یک سیستم تشخیص متن قوی هستید، درنگ نکنید.