این روزها توی هر سایت ریز و درشتی که سر بزنی تا دلت بخواد غلط املایی پیدا می کنی (البته بیشتر در مورد فرومها). غیر از سایتها برگه های امتحان رو که تصحیح می کنم باز هم شاهکارهای زیادی به چشم می خورد! من که خیلی غصه می خورم. کلماتی مثل سپاسگزار و درخواست را می نویسند سپاسگذار و درخاست! مطمئن رو می نویسند مطمعن! و بدتر از اون مطمئنا رو می نویسند مطمعنن! آدم می مونه که بخنده یا گریه کنه. اون یکی دیگه ادعای کتاب نوشتن داره: توی کتابش مرئی رو نوشته مرعی و اوج فاجعه آنجاست که افزودن رو نوشته افضودن. توی سایت خبری طرف نظر داده، کلی ابراز وجود کرده یه جوری که آدم احساس می کنه علامه دهره، بعد توی متنش نوشته مثلن تو همین ایران ما کسی حاظر نیست…(یعنی همون مثلا و حاضر) اگر اشتباه نکنم این مدلیش رو هم دیدم (مصلن). امروز هم که توی یک سایت دیگری داشتم مطالعه می کردم دیدم گزاف رو نوشته گذاف. بامزه تر از همه اینها، روزی رفتم یه جایی! طرف دنبال پرونده ام می گشت، گفت فامیل شریفتون چی بود، گفتم خسروی. منشی بنده خدا هی گشت و پیدا نکرد. اخر سر خودم گشتم دیدم روی یک پرونده ای با خط نستعلیق نوشته شده آقای خصروی! گفتم شاید این باشه! طرف پیش منشی خودش کلی شرمنده شد!
نکنید این کارا رو! دودش توی چشم خودتون می ره.
از غلطهای املایی که بگذریم در صحبتها هم خیلیها نمی فهمند چه می گویند؛ مثالهای زیادی پیش آمده لیکن جای بیانش نیست. بهتره یه خاطره که دکتر انوشه نقل می کرد رو بگم و بحثم رو کوتاه کنم: دکتر انوشه می گفت، با همکارم (آقای دکتر) رفتیم عروسی یکی از دانشجویان وقتی رسیدیم خونه طرف، گفت: فریدون برو که تا گلو رفتی تو خرخره!
یک راهنمایی گرامری: کلماتی مثل سپاسگزار و قانونگذار را چگونه درست بنویسیم؟
هر گاه در معنی گذاشتن به معنی تعیین کردن یا گذاشتن بود باید گذار استفاده کنیم مثل قانونگذار یا تاثیرگذار و اگر به معنای به جا آوردن یا انجام دادن بود (گزاردن) از گزار استفاده می کنیم: مثل نمازگزار، سپاسگزار یا خدمتگزار
هر جا هم که کم آوردید از لغت نامه دهخدا کمک بگیرید.
از این فنگلیش هم که دل پری دارم که نپرس، خدا را شکر لااقل دانشجوهام (به خاطر جواب گرفتن ایمیلشان) فارسی ایمیل می زنند. شما هم سعی کنید به فارسی نوشتن عادت کنید یا اگر جگرش رو دارید انگلیسی خالص بنویسید! اونقدر تایپ فارسی رو قوی بشید که بدون صفحه کلید فارسی بتونید بنویسید مثل من!
فارسی را پاس بداریم
شاید شما هم به سایتهایی برخورد کرده باشید که به شما امکان تبدیل فنگلیش به فارسی رو می دهند. به نظر من این سایتها کمک بزرگی در حق زبان فارسی می کنند که شاید از OCR فارسی هم مهمتر باشه! متاسفانه بسیاری از کاربران وب فارسی زبان به زبان مجعول پنگلیش (نوشتن فارسی با لغات انگلیسی) عادت کرده اند؛ زبانی بسیار مزخرف که خواندن آن برای من یکی که از خواندن خط میخی هم سخت تره! سایت بهنویس که امروز باهاش آشنا شدم به درد من نمی خوره چون خدا رو شکر صفحه کلید فارسی رو از بَـرَم حتی اگر برچسب فارسی نداشته باشه! ولی به درد دانشجوهام حتما می خوره چون ۹۹ درصدشون به طور غریزی فنگلیش کار می کنند؛ {البته با اصرار من این درصد به ۹۰ کاهش یافته و به زودی تک رقمی هم خواهد شد!}
در تصویر زیر نمونه ای از کار بهنویس رو مشاهده می کنید، واقعا الگوریتمش فوق العاده کار میکنه.
هر چی برای این سایت تابناک نظر میدم که آقا تو رو خدا یه تغییری توی خودتون بدید، اصلا انگار نه انگار. کاف به این خوش تیپی «ک» رو که مینویسند «
» که خیلی عربیه. «ی» به این خوشگلی رو ول کردن و جاش مینویسن «
» که با اون دو نقطهی زیرش حال آدم رو دگرگون میکنه. آخریش هم که واقعا آزار دهنده است نحوهی نوشتن ارقام و ممیزها است. مثلا میخواد بنویسه ۱۱٫۵ میلیون تومان یه چیزی تو این مایهها مینویسه
که معلوم نیست ۵٫۱۱ یا ۱۱٫۵؛ به هر حال از این لحاظ خیلی سایت مزخرفیه. این اواخر یکبار از مردم خواست که مشکلات سایت رو بگن، شاید صد نفر همین موضوعات رو گفتند ولی انگار نه انگار. در عوض تا دلتون بخواد از سایت تبیان خوشم مییاد. تمام قواعد زبان رو رعایت میکنه، ضمن اینکه طراحی فوقالعادهای هم داره.
عزیزان دل برادر، فارسی را پاس بدارید.
دوستانی که دنبال یک OCR فارسی میگردید نگردید چرا که از سه حالت خارج نیست: یا گیر نمیاد یا گیر میاد ولی به درد نمی خوره، یا گیر میاد به درد هم میخوره ولی به درد مرفهین بیدرد!
محصولات OCR فارسی که لااقل برای ما گیر نمیاد:
Verus از NovoDynamics با قیمت ۶۵۰۰ دلار ناقابل، Automatic Reader یا القاری العالی یا آنچه که در ایران به نام صخر میشناسیم به قیمت ناقابل ۴۵۰۰ دلار. یکی دو نرم افزار دیگه هم سالهاست که اسمشون هست ولی خبری ازشون نیست مثل OCR مدیانیک و OCR سپنتا.
محصولات OCR فارسی که گیر میاد ولی به درد نمیخوره:
ReadIris از Iris که نسخهی کرک شدهاش به ثمن بخس و به جای بلبل به فروش میرسد. دقت متوسط این نرم افزار چیزی حدود ۶۵% است که خیلی وقتها بهتر است دوباره تایپ کنیم! تا اینکه از خروجی این نرم افزار استفاده کنیم.
واژه شناس از شرکت هوش مصنوعی رایورز که این روزها همهی مردم کوچه و بازار هم فهمیدهاند که این همان Automatic Reader بدبخت است که توسط جماعت ایرانی هک شده و پس از فارسی سازی منوها به عنوان محصول یک شرکت با قیمت ۳۲۰ هزار تومان به فروش میرسد. خدا را شکر، نسخهی هک شدهاش هم کرک شده! و به راحتی در بازار یافت میشود.
خودنگار از پژوهشکدهی هوشمند علائم که به شکل عجیبی (بستهی نرمافزاری آن یک OCR انگلیسی را نشان میدهد) و به قیمت ۲۰۰ هزارتومان عرضه میشود. اطلاعات چندانی از نسخهی جدید این نرم افزار که سالهاست خبری از آن نیست، در دست نیست. لیکن اگر مثل نسخهی قبلی اش باشد که خدا به خریدارش رحم کند.
محصولات OCR فارسی که گیر میاد به درد هم میخوره ولی به درد مرفهین بیدرد:
در این زمینه تنها یک محصول هست که امکانات واقعا کاملی داره و لیکن پول واقعا کاملی هم باید بپردازید! نویسه خوان آراکس محصول شرکت هدی سیستم که به قیمت ۱۵۶۲۵۰۰ تومان (بله ۱٫۵ میلیون تومان) به فروش میرسد.
واما پرشیانگار
تنها محصولی که هم گیر میاد، هم به درد میخوره و البته به درد شما (غیر مرفهین بادرد!) میخوره. یک OCR دقیق، سریع و زیبا مخصوص زبان فارسی. یکی دو روز دیگر تا پایان تخفیفات ویژهی این نرم افزار باقی نمانده، اگر واقعا به دنبال یک سیستم تشخیص متن قوی هستید، درنگ نکنید.






