درباره‌ی اين وبلاگ

دقيقاً 30 سال پيش، زمانی كه ايران گرفتار بود در درگيری‌های داخلی، و هنوز از فضای آزادِ انقلاب خردك شرری به جا بود، نخستين شماره‌ی هفته‌نامه‌ی كتاب جمعه به سردبيریِ احمد شاملو در 161 صفحه و به بهای 100 ريال منتشر شد.

در تاريخِ مطبوعاتی كه در دانشگاه‌های ايران تدريس می‌شود حرفی از اين نشريه و نشرياتِ مشابه كه در آن دوران به وسع‌شان روشنگری می‌كردند به ميان نمی‌آيد. از اين‌كه چه كسانی، در چه فضايی، چگونه كارِ مطبوعاتی می‌كردند و چرا و چگونه از كار بازمی‌ماندند چيزهای زيادی نخوانده‌ايم. به هر حال كتاب جمعه فقط در 36 شماره منتشر شده است.

اما اين‌كه چرا نويسندگانِ اين وبلاگ قصد دارند اين مجله‌ها را از كتابخانه‌های شخصی به اينترنت بكشانند، عمدتاً به خاطرِ حوادثِ اين روزهای جامعه‌ی ايران است كه شباهت‌های عجيبی دارد با آن‌چه 30 سال پيش اتفاق افتاده. اين را سرمقاله‌ی شماره‌ی اولِ كتاب جمعه به روشنی نشان‌مان می‌دهد، اگر كه باور داشته باشيم نوشته‌های هر دوران آينه‌ی زمانه‌‌ی خودند. واضح‌ترين شباهت، البته، توقفِ انتشارِ كتاب جمعه بعد از فقط 10 ماه فعاليت است. فكر كرديم شايد اين وبلاگ (موقتاً) جايی باشد برای هم‌فكری و همكاری برای آن‌لاين كردنِ بايگانیِ مجله‌های كم‌ياب.

آن‌لاين كردنِ بايگانیِ اين مجله كارِ پردردسری است. به فكرمان رسيده است كه مجله‌ها را اسكن كنيم كه راه‌حلّ مناسبی نيست. مشكل اين است كه متن‌ها عكس‌هايی می‌شوند كه قابليت جستجو نخواهند داشت. پرس‌وجو كرديم برای يافتنِ نرم‌افزاری كه عكس را به متن تبديل كند. گويا برای زبانِ انگليسی چنين نرم‌افزاری موجود است. اما برای زبانِ فارسی.. شما می‌دانيد چه می‌شود كرد؟

Advertisements

39 پاسخ to “درباره‌ی اين وبلاگ”

  1. یه دوست Says:

    من در مورد کارکردش اطلاعات زیادی ندارم ولی تنها نرم افزار OCR فارسی
    http://www.farsiocr.com/
    هست که البته رایگان نیست

  2. رضا Says:

    اگه این شرکته تا الان از هم نپاشیده باشه ممکنه یه نسخه از نرم‌افزارش رو در اختیار این پروژه بزاره مثلاً در ازای اینکه لوگوش رو در سایدبار بزارین. قبلش یه صفحه آزمایشی بفرست، کیفیت کارش به فونت استفاده شده وابسته هستش:
    http://www.aisoft.ir/fa/ocr-demo.aspx
    نمونه اپن‌سورس ocr هم باید باشه ولی احتمالاً حداقل برای فارسی کیفیت مناسبی نداشته باشه.

  3. یک نفر Says:

    خب از این OCRهای برای فارسی هم داریم که.
    البته به خوبی لاتین‌ها کار نمی‌کنن. پول هم باید بابتشون داد.
    وی به عنوان پلات‌فرم برای کار خوبی که می‌خوای بکنی قابل استفاده‌ن.
    اونایی که من می‌شناسم یکی‌ش «هوش مصنوعی رایورز» ئه.
    یکی‌ش هم Readiris Pro البته فارسی شده‌ش.
    البته من با هیچ‌کدوم شخصا کار نکردم. ولی ادعاشون که زیاده و میگن این
    نسخه خاورمیانه‌ای که از خودشون در کردن جواب داده.

  4. نیما Says:

    به چنین نرم‌افزارهایی اُ سی آر می‌گن. اُ سی آر فارسی توی بازارهای جهانی هست. این نمونه خارجیشه: Readiris Pro 11 Corporate Middle-East
    این نمونه ایرانیشه:
    http://www.farsiocr.com/arax

  5. مصطفی Says:

    برام مهم نیست…من تو امروز زندگی می کنم نه سی سال پیش

  6. Reza Says:

    پیشنهاد میدم هر کدوم از خواننده‌های این وبلاگ که از علاقمندان این سری مجله هستند، یک بخش کوچک از مجله رو بگیرن (شما میتونید به شکل فایل اسکن شده براشون بفرستید) و کار تایپش رو انجام بدن

  7. جوان ایرانی Says:

    با سلام

    به نظر من حتی اگه بشه با نرم افزارهای OCR هم کاری انجام داد. گزاشتن اسکن مجله‌ها واقعا کار خوبیه. چون شاید کسانی دوست داشته باشند اصل صفحه ها رو هم داشته باشند. عالی میشد واقعا :)

  8. فرانك Says:

    سلام،
    همان طور كه هموطنان عزيز اشاره كرده اند، چاره كار «او سي آر»(optical character recognition) است. به اين صورت كه تصوير اسكن شده متن را به صورت ورودي به برنامه موردنظر بدهيم و يك فايل نوشتاري(text) را از خروجي دريافت كنيم.
    بر اساس تحربه من نرم افزارهاي او-سي-آر موجود براي زبان فارسي كارايي قابل قبولي ندارند، ولي يك او سي آر كارا براي زبان عربي وجود دارد: http://www.sakhr.com/products/OCR/Default.aspx?sec=Product&item=OCR
    كه مي توان از آن استفاده كرد و بعد متون حاصله را ويرايش كرد.

    مجموعه كتاب جمعه، بسيار ارزشمند است و البته كمياب. هر گونه تلاشي جهت انتشار مجدد آن كه قطعاً باعث مانايي آن مي شود بسيار شايسته است.

    پايدار باشيد.

  9. س م Says:

    خب، چرا به مرور و به کمک یک گروه داوطلب متنها را از نو تایپ نمیکنید؟ 36 شماره که بیشتر نیست! البته شاید بشود از همان روش اسکن هم استفاده کرد و برای هر شماره نمایه ای ساخت و ضمیمه کرد به طوری که امکان جست و جو هم فراهم شود. من برای همکاری داوطلبم.

  10. علیرضا Says:

    هیچ کدام از ocrهای فارسی، دقت خوبی ندارند و نتایج آنها را باید ادیت کلی کرد.
    شرکت‌های ایرانی به خاطر مشکلات کپی رایت و سرمایه‌گذاری، هیچ کدوم نتونستن، نرم‌افزار مستقل و خوبی بنویسن. در مقام مقایسه با ocrهای انگلیسی که دقتی دستکم بالای 90 درصد دارن، آدم واقعا ناامید و مایوس می‌شه.
    پیشنهاد می کنم، روی همون اسکن تمرکز کنین. مگه اینکه وقت زیاد برای ادیت یا تایپ دستی داشته باشین.

  11. من Says:

    خدا قوت
    کار گِل است ولی اسکن متن ها را تقسیم کرده و تایپ کنیم.

  12. رضا Says:

    همه ۳۶ شماره اینقدر مفصل هستند؟ اگر آره، حتی اسکن کردنشان هم سخت خواهد بود. اگر اونطوری که دوستان می‌گویند گزینه ocr فارسی با دقت مناسب نداشته باشیم و هر صفحه نیاز به ویرایش زیاد داشته باشد، در صورت کم بودن تعداد صفحات تایپ کردنشان به طور داوطلبی احتمالاً راحت‌تر خواهد بود.
    در مورد اسکن صفحات فکر کنم مرکزی بود که خاص مجلات دستگاه داشت که اتوماتیک صفحات رو اسکن می‌کرد. مطمئن نیستم magiran بود، کتابخانه ملی بود یا اینکه اشتباه یادم مونده؛ می‌پرسم.

  13. چوبین.بلاگِر Says:

    به چند دلیل اسکن‌کردنِ دوره‌ی 36شماره‌یی، بهترین کار ِ ممکنه:
    اوّل این‌که هر شماره‌ی کتاب‌جمعه خیلی مفصّل و عریض و طویل بود و تایپ ِ حتّا یک‌شماره از هفته‌نامه هم کار بسیار وقت‌گیر و طاقت‌فرسائی‌یه که حالاحالاها تموم نمی‌شه، و درنتیجه ممکنه ماه‌ها و حتّا بی‌گفت‌وگو سال‌ها طول بکشه تا چنین کاری تمام و کمال به‌انجام برسه.
    دوّم این‌که کتاب‌جمعه بخش‌های مختلفی داشت که ممکنه خیلی از اون‌ها امروز به‌دردِ جامعه‌ی ما بخوره یا نخوره؛ مسلّماً سرمقاله‌های شاملو و کاریکاتورهای کتاب‌جمعه خیلی بیش‌تر کاربرد و خواهان داره تا به‌طور مثال اون یکی‌دو مقاله‌یی که به‌گمونم باجلان فرّخی درباره‌ی راه‌اندازیِ ایستگاه‌های رادیویی با امکانات و وسائل ِ اون‌دوره تهیّه کرده بود. پس، تایپ ِ همه‌ی مقالات آن‌چنان لازم نیست.
    سوّم هم این‌که من با توجه به تجربه‌ی کوتاه‌مدّتی که در چنین زمینه‌هایی دارم، هشدار می‌دم که به‌درازا کشیده‌شدنِ این‌پروژه، به‌مرور ِ زمان باعثِ خسته‌گی ِ دست‌اندرکاران و اعضای پروژه، و ناتموم‌موندنش می‌شه. پس بهترین‌کار اینه که به‌سرعت تموم ِ مجلّداتِ کتاب‌جمعه رو اسکن کنین تا بخش اصلی ِ کار، که بازچاپ ِ این هفته‌نامه‌ی سترگ بود به‌پایان برسه، و بمونه بخش دوّم یا همون تایپ ِ گلچین ِ مقالات که بسته به همّت و پشتکار ِ اعضا داره.

  14. absrd Says:

    کاری که دست گرفته اید بی اندازه ارزشمند است . در مورد ocr می توانید اینجا را هم ملاحظه کنید :
    http://1pezeshk.com/archives/2008/07/_ocr.html

    موفق باشید .

  15. خروس خوان Says:

    سلام
    هر کس که در دست گرفتن کتاب هفته و بعدتر جمعه اش را آزموده باشد و عطر خوب کاغذ کاهی ش را بو کشیده باشد، حتمن کیف می کند و ذوقش می گیرد از ورق زدن دوباره تک تک برگ هایش در دنیای غریب وب به هر هیبتی و شمایلی که باشد.
    در هر حال فعلن فقط شدیدن سپاس…

  16. فرنی Says:

    خدا قوت

  17. دودینگ هاوس Says:

    چه خوب. دست تون درد نکنه واقعا.

  18. صفا Says:

    درود
    یک پیشنهاد دیگه
    علاوه بر استفاده از او سی آر، می تونین متن های اسکن شده رو در اختیار داوطلبان قرار دهید تا اونها رو تایپ کنن. من خودم اعلام آمادگی می کنم برای این کار. یک عده داوطلب دیگه هم می تونن متن های تایپ شده رو مقایسه کنن با متن ها تا دقت کار بالا بره.
    سپاس

  19. صادق صادقی Says:

    سلام
    اگربه نتیجه تایپ مجدد رسیدید من هم به سهم خودم آماده هستم برای همکاری.

  20. نوژان Says:

    پیشنهاد می دم اول یک فراخوان بدید برای تایپ مجدد و از همه بخواید که اطلاع رسانی کنند تو سایت هایی مثل فیس بوک یا توییتر و … و ببینید چند نفر پیدا می شن که حاضرن کمک کنند برای تایپ مجدد. اگر تعداد زیاد بود تایپ مجدد رو شروع کنید. اگر نه راه های دیگه رو آزمایش کنید. می تونید زمانی هم برای این فراخوان در نظر بگیرید که کار به درازا نکشه.

  21. sormeh Says:

    اگر کار به تایپ یا ادیت رسید روی همکاری من هم می توانید حساب کنید.

  22. نیلوفر Says:

    من هم برای تایپ آمادگی دارم. گرچه دسترسی به مجله ها ندارم ولی اگر به نحوی در اختیارم بگذارید حتماکمک خواهم کرد. چه در تایپ و چه در کنترل
    از کاری که میکنید ممنونم .

  23. سجاد Says:

    من هم حاضرم کمک کنم و قتی برداشتن سنگریزه ها را شروع کنیم می توانیم کوهی را از سر راه برداریم.

  24. سجاد Says:

    راستی نرم افزار osiris 11 هم هست به هر حال بعد از تبدیل باید حک و اصلاح شود بهترین نرم افزار تا 70 درصد تبدیل دارد. تازه غیر از کتاب جمعه مجموعه های باارزش دیگری هم هست مثل زاینده رود و …

  25. ریحانه Says:

    واقعا دمتون گرم!!
    من هم برای تایپ کردن آمادم! :)

  26. هومان Says:

    می توان در ابتدا مجله را اسکن کرد و روی وب
    گذاشت. برای اضافه کردن قابلیت جستجو هم از هر مقاله یک سری کلمه کلیدی گذاشت.

  27. نازی Says:

    بهتره این کار رو چند فاز بکنین. فاز اول اسکن مجله رو بگذارید رو وب. در فاز دوم با نرم افرازهای OCR اونها رو به متن تبدیل کنین و با کمک داوطلبان اونها رو اصلاح و بررسی کنین. نیازی هم نیست که خیلی کار سنگینی انجام بدین. یه قسمت در سایت ایجاد کنین هرکی توی سایت اومد و دلش خواست بره یک صفحه رو برداره و در سایت چک کنه. تغییرات هم توسط یکی از اعضای سایتتون بررسی و تایید بشه. اگر متن تایید شد، از متونی که باید ویرایش بشن خارج میشه و در متون مورد استفاده قرار می گیره.( این یه سیستم نرم افزاری کوچیکه که خیلی از برنامه نویسا می تونن به راحتی بنویسن)

  28. پگاه Says:

    من چندين جلد از كتاب جمعه رو از كتابخونه ي عموم كش رفتم و خوندم البته هنوز بهش پس ندادم و شايد هيچوقت پس ندم. اما يه چيزي بگم. وقتي مقاله هاش، تحقيق ها و شعر و داستانهاشو خوندم اكثرن خيلي از ما كه در اين زمونه با اين حجم اطلاعات و تحقيقات گسترده سرو كار داريم عقبن. شما براي يكي از آداب و رسوم در دورترين نفاط دنيا كافيه يك سرچ كوچولو كنيد. نميخوام بگم كه كارتون بي فايده است. كتاب جمعه از گنجينه هاي گذشته فرهنگ و مطبوعات ماست. اميدوارم موفق باشي.

  29. شهریار Says:

    یک مدل همیاری مثل ویکیپیدیا شاید به درد این کار بخورد. برای این کار یک سایت ویکی راه بیاندازید (یا از ویکی‌های موجود استفاده کنید). صفحات اسکن شده را در صفحات ویکی جای بدهید. بعد از مردم بخواهید که بیایند و هر یک هر کجا که دستشان رسید را تایپ کنند و یا اصلاح کنند (مثلا قبلا OCR شده‌ها را اصلاح کند)

  30. پونه بريراني Says:

    اگر تصميم به تايپ تدريجي كارها گرفتيد…من حاضرم با گروهي كه قرار است تايپ كنند هم‌كاري كنم….متاسفانه كاري بيش از اين از دست من ساخته نيست.

  31. arash Says:

    نرم افزار Pdfgrabber كه آخرين نسخه اون 5 هست ميتونه تا pdf رو به Word‌تيبديل كنه ولي واسه كار شما Readiris Pro البته نسخه ME ميتونه تا حدودي كارت رو راه بندازه ولي خيلي نميشه روش حساب كرد. من با روش ويكي كه آقا شهريار فرمودن موافقم. اگه شروع كردين بهم ميل بزنين.

  32. رامسری Says:

    بیاد شاملو ومرداد که او زنده .،ای خداوندان خوف انگیز شب پیمان ظلمت دوست !
    تانه من فا نوس شیطان رابیاویزم ،دررواق هرشکنجه گاه پنهانی این فردوس ظلم آیین ،
    ظلمت آباد بهشت گند تان را دربه روی من باز نگشا یید .

  33. فرانك Says:

    ايده شهريار عاليه. من هم مي تونم كمك كنم. كافيه صفحات اسكن شده را داشته باشيم.

  34. Atefeh Says:

    be yade Shamlooye bozorg az samime ghalb hazeram type ketabe jome ro anjam bedam. khoshal misham manam sahim konin. mamnoon

  35. هادی Says:

    نرم افزارهای ایرانی بسیار مزخرفند.
    از Read iris و Assakhr هم آبی آنچنان گرم نمی شود.
    به فکر اسکن و تایپ باشید. یا اسکن و تگ کردن واژه های مهم هر تصویر

  36. محسن Says:

    براي تايپ تدريجي متن ها من هم آماده ام. اگر چنين تصميمي گرفته شد لطفا به من هم اطلاع دهيد.

  37. AminePopuya Says:

    مراجعه به وبلاگ زیر می تواند در مورد OCR فارسی مفید باشد.

    http://www.ocr.blogfa.com

    [url]http://www.ocr.blogfa.com[/url]

  38. رها Says:

    با درود بسیار و سپاس از زحماتی که متحمل شده اید…
    بی هیچ دریغی مایل هستم که مطالب را تایپ و برای شما دوستان ارسال نمایم… هر چند کتاب باشد و به هر شکلی…
    امید روزنه یی باشد در این نابسامان بازار

  39. رضا جلالی Says:

    با سلام و سپاس از ایده و همت عالی تان . . . اولا او سی آر فارسی همچین هم کار راحتی نیست و سال ها بعنوان پروزه ای ملی مطرح بود !!!
    اواسط دهه هفتاد شمسی ، نرم افزار OCR فارسی تحت نام تجاری شناسا به بازار رسید ؛ ولی اینکه هنوز هست یا نه یا رقبایی برایش پیداشدند یا خیر ، دیگر خبر جدیدتر ندارم.
    دوستان راجع به دقت پایین برنامه های فارسی حق دارند ولی اگر با این مجموعه آشنا باشید ، تماما با یک قالب به طبع رسید و از این رو فونتوگرافی ثابتی دارد .
    برنامه شناسا تا آنجا که به خاطرم هست قابلیت آموزش دیدن داشت و با این کار وقتی فهمش نسبت به اشکال حروف ارتقاء می یافت ، از دقت قابل قبولی برخوردار می شد.

پاسخی بگذارید

در پایین مشخصات خود را پر کنید یا برای ورود روی شمایل‌ها کلیک نمایید:

نشان‌وارهٔ وردپرس.کام

شما در حال بیان دیدگاه با حساب کاربری WordPress.com خود هستید. بیرون رفتن / تغییر دادن )

تصویر توییتر

شما در حال بیان دیدگاه با حساب کاربری Twitter خود هستید. بیرون رفتن / تغییر دادن )

عکس فیسبوک

شما در حال بیان دیدگاه با حساب کاربری Facebook خود هستید. بیرون رفتن / تغییر دادن )

عکس گوگل+

شما در حال بیان دیدگاه با حساب کاربری Google+ خود هستید. بیرون رفتن / تغییر دادن )

درحال اتصال به %s


%d وب‌نوشت‌نویس این را دوست دارند: