📱 GitHub Repo
مرجع دیتاست فارسی のテレグラム投稿

لطفا برای معرفی و درج دیتاست خود داخل کانال به @data_hub پیام دهید.
2,972 人の購読者
22 枚の写真
22 本の動画
最終更新日 11.03.2025 07:49
類似チャンネル

26,150 人の購読者

5,372 人の購読者

3,335 人の購読者
مرجع دیتاست فارسی によってTelegramで共有された最新のコンテンツ
یک چتبات پزشکی کاربردی که میتواند به سوالات مختلف کاربران در زمینه سلامت و پزشکی پاسخ دهد. این پروژه با هدف ایجاد یک ابزار مفید برای دسترسی آسان و سریع به اطلاعات پزشکی و مشاوره اولیه طراحی شده است. این چتبات میتواند در کلینیکها، بیمارستانها، سایتهای سلامت و حتی اپلیکیشنهای موبایل مورد استفاده قرار گیرد (التبه نیاز به بهبود دارد). همچنین قابل استفاده در پروژههای هوش مصنوعی و پردازش زبان طبیعی است.
📱 GitHub Repo
📱 GitHub Repo
من دوتا دیتاست فارسی ساختم اخیرا که جزو بزرگترینها توی نوع خودشونن
دیتاست اسامی و جنسیتشون که شامل نگارش انگلیسی اسامی هم هست
لینک هاگینگفیس و گیتهاب
https://huggingface.co/datasets/farbodbij/persian-gender-by-name
https://github.com/farbodbj/persian-gender-by-name
دیتاست فامیلیها و درصد تکرارشون:
https://huggingface.co/datasets/farbodbij/iranian-surname-frequencies
https://github.com/farbodbj/iranian-surname-frequencies
دیتاست اسامی و جنسیتشون که شامل نگارش انگلیسی اسامی هم هست
لینک هاگینگفیس و گیتهاب
https://huggingface.co/datasets/farbodbij/persian-gender-by-name
https://github.com/farbodbj/persian-gender-by-name
دیتاست فامیلیها و درصد تکرارشون:
https://huggingface.co/datasets/farbodbij/iranian-surname-frequencies
https://github.com/farbodbj/iranian-surname-frequencies
راهنمای کاربردی و ساده برای ساخت چتبات به زبان فارسی!
این پروژه شامل یک چتبات ساده به زبان فارسی است که با استفاده از الگوریتمهای پردازش زبان طبیعی (NLP) و مدلهای ترکیبی نوشته شده است. هدف این پروژه، فراهم آوردن یک مثال عملی و آموزشی جهت پیادهسازی چتباتهای زبان فارسی میباشد.
این چتبات برای پاسخ به سوالات متداول و ارائه اطلاعات ساده در محیطهای کاربردی مختلف مثل وبسایتها و اپلیکیشنها قابل استفاده است.
با مراجعه به این لینک، میتوانید به کدمنبع و مستندات پروژه دسترسی پیدا کنید و با استفاده از راهنماهای موجود، چتبات خود را بسازید.
📱 GitHub Repo
این پروژه شامل یک چتبات ساده به زبان فارسی است که با استفاده از الگوریتمهای پردازش زبان طبیعی (NLP) و مدلهای ترکیبی نوشته شده است. هدف این پروژه، فراهم آوردن یک مثال عملی و آموزشی جهت پیادهسازی چتباتهای زبان فارسی میباشد.
این چتبات برای پاسخ به سوالات متداول و ارائه اطلاعات ساده در محیطهای کاربردی مختلف مثل وبسایتها و اپلیکیشنها قابل استفاده است.
با مراجعه به این لینک، میتوانید به کدمنبع و مستندات پروژه دسترسی پیدا کنید و با استفاده از راهنماهای موجود، چتبات خود را بسازید.
📱 GitHub Repo
دوستی اومدن و مدل T5 فاین تیون کردن ک بتونه متون رسمی به محاوره تبدیل کنه و برعکس.
📱 GitHub Repo
📱 GitHub Repo
این دیتاست شامل اطلاعات ارزشمند از پتنتهای ثبت شده در ایران است. مجموعه داده Persian-Patent-Dataset جمعآوری شده از منابع معتبر و کامل، توسط توسعهدهندگان برای استفاده پژوهشگران و علاقهمندان به تحلیل پتنتها و نوآوریها. این دیتاست شامل ویژگیهایی چون عنوان، خلاصه، شماره پتنت، سال ثبت و نام مخترع است. این مجموعه برای تحقیقات دانشگاهی، تحلیلهای حقوقی و توسعه مدلهای یادگیری ماشین در زمینه حقوق مالکیت فکری مناسب میباشد.
📱 GitHub Repo
📱 GitHub Repo
به دنبال یادگیری Markdown به زبان فارسی هستید؟ این لینک یک آموزش جامع و کامل از مارکداون به زبان فارسی است. این مخزن شامل توضیحات مفصل و مثالهای کاربردی برای تمامی سینتکسها و ویژگیهای مارکداون است. این مجموعه برای برنامهنویسان، بلاگرها و هر کسی که میخواهد متون خود را به صورت شکیل و تمیز فرمت کند، بسیار مفید و کاربردی است. یادگیری مارکداون به شما کمک میکند تا مستندات و متون خود را به راحتی و با کیفیت بالا ایجاد کنید.
📱 GitHub Repo
📱 GitHub Repo
🔍 شناسایی اخبار جعلی فارسی:
این مخزن شامل مجموعه دادهای از اخبار جعلی به زبان فارسی است که به منظور شناسایی و تمایز اخبار واقعی از جعلی در رسانهها و شبکههای اجتماعی ایجاد شده است. از طریق این مجموعه، پژوهشگران و توسعهدهندگان میتوانند الگوریتمها و مدلهای یادگیری ماشین خود را برای تشخیص اخبار تقلبی بهبود بخشند.
📚 کاربردها:
- پروژههای یادگیری ماشین: آموزش مدلها برای تشخیص و طبقهبندی اخبار جعلی.
- پردازش زبان طبیعی (NLP): تجزیه و تحلیل متون فارسی و بهبود دقت مدلهای NLP.
- مطالعات رسانهای: بررسی و تحلیل صحت اخبار منتشر شده در رسانههای فارسیزبان.
از این مجموعه داده میتوان برای بهبود امنیت اطلاعات و جلوگیری از انتشار اطلاعات نادرست در جامعه استفاده کرد.
📱 GitHub Repo
این مخزن شامل مجموعه دادهای از اخبار جعلی به زبان فارسی است که به منظور شناسایی و تمایز اخبار واقعی از جعلی در رسانهها و شبکههای اجتماعی ایجاد شده است. از طریق این مجموعه، پژوهشگران و توسعهدهندگان میتوانند الگوریتمها و مدلهای یادگیری ماشین خود را برای تشخیص اخبار تقلبی بهبود بخشند.
📚 کاربردها:
- پروژههای یادگیری ماشین: آموزش مدلها برای تشخیص و طبقهبندی اخبار جعلی.
- پردازش زبان طبیعی (NLP): تجزیه و تحلیل متون فارسی و بهبود دقت مدلهای NLP.
- مطالعات رسانهای: بررسی و تحلیل صحت اخبار منتشر شده در رسانههای فارسیزبان.
از این مجموعه داده میتوان برای بهبود امنیت اطلاعات و جلوگیری از انتشار اطلاعات نادرست در جامعه استفاده کرد.
📱 GitHub Repo
مجموعه ابزار قدرتمند برای پردازش و کار با متنهای فارسی! با استفاده از این کتابخانه، شما میتوانید به راحتی و به صورت کارآمد متنهای فارسی را مورد پردازش قرار دهید. این ابزارکها شامل قابلیتهایی نظیر توکنایز کردن، نرمالسازی، ریشهیابی و سایر عملیات مرتبط با زبان فارسی هستند که میتواند در پروژههای NLP و متنکاوی به شما کمک کند. با استفاده از این کتابخانه، فرآیند پردازش زبان فارسی در پروژههای خود را سریعتر و دقیقتر کنید.
📱 GitHub Repo
📱 GitHub Repo
این ابزار وبکِرولِر فارسی برای جمعآوری اطلاعات از وبسایتهای مختلف فارسی طراحی شدهاست. Persian Web Scraper با تمرکز بر زبان فارسی به شما کمک میکند تا دادههای مورد نیاز خود را به صورت سریع و کارآمد استخراج کنید. این ابزار میتواند در پروژههای دادهکاوی، تحلیل محتوا و سایر بررسیهای مبتنی بر دادههای اینترنتی مورد استفاده قرار گیرد.
📱 GitHub Repo
📱 GitHub Repo
این نوتبوک جالب در لینک ارائهشده، شامل کدها و توضیحات کاربردی برای یادگیری مبانی پایتون است. مجموعهای از مثالهای ساده و قابل فهم که به شما کمک میکند تا مهارتهای برنامهنویسی خود را افزایش دهید. اگر در حال شروع یادگیری پایتون هستید یا نیاز به مرور مفاهیم پایه دارید، این نوتبوک میتواند بهترین مرجع برای شما باشد. ضمناً، از این نوتبوک میتوانید در محیطهای آموزشی و دورههای برنامهنویسی بهره ببرید.
📱 GitHub Repo
📱 GitHub Repo