گردهمایی متخصصان و علاقهمندان برای توسعهٔ اسکریپتها و مدلهای متنباز فارسی—با مشارکت بخش خصوصی.
Rakhshai یک کتابخانهٔ پژوهشی برای تبدیل متنهای فارسی به ساختارهای گرافی و تحلیل آنها با روشهای
شبکههای عصبی گرافی است. این ابزار با الهام از TextGCN/GCN/GraphSAGE طراحی شده و برای کارهایی مثل
طبقهبندی متن، خلاصهسازی مبتنی بر TextRank، توصیهگر محتوا، تشخیص نفرتپراکنی و تحلیل شبکههای
اجتماعی بهکار میرود. مستندات کامل و مثالها در docs/ و تستها نیز فراهم است.
rgnn-cli)
نَغز یک کتابخانهٔ سبک برای پردازش زبان طبیعی فارسی است که بهصورت کتابخانهٔ پایتون و ابزار خط فرمان ارائه میشود. امکانات اصلی آن شامل نرمالسازی، توکنیزهکردن، تبدیل محاوره به رسمی، تحلیل احساس، استخراج موجودیتهای نامدار و خلاصهسازی استخراجی است. همچنین پشتیبانی اختیاری از برچسبگذاری نقش کلمات (POS) و تجزیهٔ وابستگی با مدلهای Stanza دارد.
naghz)
هوش مصنوعی Cyrus یک دستیار پرسش و پاسخ فارسی مبتنی بر جنگو است که متن ورودی را نرمالسازی میکند، متون مرتبط را با استفاده از ترکیبی ترکیبی از جستجوی برداری FAISS و جستجوی واژگانی BM25 بازیابی میکند و با مدل LLaMA پاسخ تولید میکند.
/api/ask
این پروژه یک سرویس ساده برای تحلیل متون فارسی است که با استفاده از Django و Django REST Framework پیادهسازی شده است. برای پردازش متن از کتابخانهی Hazm جهت نرمالسازی و از رویکردهای سبک و لغتمحور برای تحلیل احساس و تشخیص موجودیتهای نامدار استفاده شده است. این رویکرد تکیهای بر مدلهای سنگین یادگیری عمیق ندارد و در نتیجه امکان اجرا به صورت کاملاً آفلاین را فراهم میکند. همچنین امکان پردازش فایلهای بزرگ بهصورت غیـرهـمگام با Celery و Redis فراهم شده است.
/api/analyze/،
/api/answer/،
/api/jobs/<id>
این پروژه ابزاری برای بررسی تداخلات دارویی و تطبیق برچسبهای دارویی است. هدف آن ارائهی سیستمی هوشمند جهت تحلیل دادههای دارویی، شناسایی هشدارها، و کمک به داروسازان و پزشکان برای تصمیمگیری ایمنتر است. این سرویس با استفاده از پایتون و کتابخانههای علمی مانند Pandas و scikit-learn توسعه یافته و قابلیت ارتباط با پایگاه دادههای استاندارد دارویی را دارد.
«باز پردازش» یک جامعهٔ متنباز برای توسعهٔ ابزارها، اسکریپتها و مدلهای پردازش زبان فارسی و کلانداده است. هدف ما تسهیل همکاری میان متخصصان و فعالان بخش خصوصی، پژوهشگران و علاقهمندان تا اکوسیستمی پایدار برای فناوری فارسی بسازیم.
این جامعه در شهریورگان (چهارم شهریور ماه) ۱۴۰۴ خورشیدی کار خود را به صورت رسمی شروع کرد .
این جامعه وابسته به شرکت آریا هامان مهر پارسه و تیم توسعهٔ هوش مصنوعی ایرانی رخشای است.
این جامعه توسط گروه توسعه دهندگان هوش مصنوعی ایرانی رخشای (شرکت آریا هامان مهر پارسه) بنیان نهاده شده است . فعالیت های انجمن در قالب فنی و مدیریتی با نظارت و پشتیبانی رسمی تیم توسعه دهندگان رخشای ادامه پیدا خواهد کرد .
دموکراتیزهکردن دسترسی به ابزارها و دانش پردازش متن فارسی از طریق نرمافزارها و مدلهای متنباز.
شفافیت کامل در تصمیمگیریها؛ ادارهٔ جامعه بر اساس رأی و اجماع مشارکتکنندگان.
تمامی بحثها، مستندات و کدها در مخازن عمومی؛ مشارکت از طریق Pull Request و Issue.
انتشار پروژهها با مجوزهای استاندارد (MIT/Apache-2.0 و …) و التزام به Code of Conduct حرفهای.
برای پیوستن به جامعهٔ اوپنسورس و مشارکت در پروژهها، رزومهٔ خود را به ایمیل زیر ارسال کنید: