مرجع دیتاست فارسی (@persian_data)の最新投稿

مرجع دیتاست فارسی のテレグラム投稿

مرجع دیتاست فارسی
لطفا برای معرفی و درج دیتاست خود داخل کانال به @data_hub پیام دهید.
2,972 人の購読者
22 枚の写真
22 本の動画
最終更新日 11.03.2025 07:49

مرجع دیتاست فارسی によってTelegramで共有された最新のコンテンツ

مرجع دیتاست فارسی

15 Feb, 05:37

1,302

یک چت‌بات پزشکی کاربردی که می‌تواند به سوالات مختلف کاربران در زمینه سلامت و پزشکی پاسخ دهد. این پروژه با هدف ایجاد یک ابزار مفید برای دسترسی آسان و سریع به اطلاعات پزشکی و مشاوره اولیه طراحی شده است. این چت‌بات می‌تواند در کلینیک‌ها، بیمارستان‌ها، سایت‌های سلامت و حتی اپلیکیشن‌های موبایل مورد استفاده قرار گیرد (التبه نیاز به بهبود دارد). همچنین قابل استفاده در پروژه‌های هوش مصنوعی و پردازش زبان طبیعی است.

📱 GitHub Repo
مرجع دیتاست فارسی

10 Feb, 08:23

1,590

من دوتا دیتاست فارسی ساختم اخیرا که جزو بزرگترین‌ها توی نوع خودشونن

دیتاست اسامی و جنسیت‌شون که شامل نگارش انگلیسی اسامی هم هست
لینک هاگینگ‌فیس و گیتهاب
https://huggingface.co/datasets/farbodbij/persian-gender-by-name
https://github.com/farbodbj/persian-gender-by-name

دیتاست فامیلی‌ها و درصد تکرارشون:
https://huggingface.co/datasets/farbodbij/iranian-surname-frequencies
https://github.com/farbodbj/iranian-surname-frequencies
مرجع دیتاست فارسی

10 Feb, 05:36

4,036

راهنمای کاربردی و ساده برای ساخت چت‌بات به زبان فارسی!

این پروژه شامل یک چت‌بات ساده به زبان فارسی است که با استفاده از الگوریتم‌های پردازش زبان طبیعی (NLP) و مدل‌های ترکیبی نوشته شده است. هدف این پروژه، فراهم آوردن یک مثال عملی و آموزشی جهت پیاده‌سازی چت‌بات‌های زبان فارسی می‌باشد.

این چت‌بات برای پاسخ به سوالات متداول و ارائه اطلاعات ساده در محیط‌های کاربردی مختلف مثل وبسایت‌ها و اپلیکیشن‌ها قابل استفاده است.

با مراجعه به این لینک، می‌توانید به کدمنبع و مستندات پروژه دسترسی پیدا کنید و با استفاده از راهنماهای موجود، چت‌بات خود را بسازید.


📱 GitHub Repo
مرجع دیتاست فارسی

08 Feb, 05:36

1,452

دوستی اومدن و مدل T5 فاین تیون کردن ک بتونه متون رسمی به محاوره تبدیل کنه و برعکس.

📱 GitHub Repo
مرجع دیتاست فارسی

03 Feb, 05:36

1,963

این دیتاست شامل اطلاعات ارزشمند از پتنت‌های ثبت شده در ایران است. مجموعه داده Persian-Patent-Dataset جمع‌آوری شده از منابع معتبر و کامل، توسط توسعه‌دهندگان برای استفاده پژوهشگران و علاقه‌مندان به تحلیل پتنت‌ها و نوآوری‌ها. این دیتاست شامل ویژگی‌هایی چون عنوان، خلاصه، شماره پتنت، سال ثبت و نام مخترع است. این مجموعه برای تحقیقات دانشگاهی، تحلیل‌های حقوقی و توسعه مدل‌های یادگیری ماشین در زمینه حقوق مالکیت فکری مناسب می‌باشد.

📱 GitHub Repo
مرجع دیتاست فارسی

01 Feb, 05:35

1,672

به دنبال یادگیری Markdown به زبان فارسی هستید؟ این لینک یک آموزش جامع و کامل از مارک‌داون به زبان فارسی است. این مخزن شامل توضیحات مفصل و مثال‌های کاربردی برای تمامی سینتکس‌ها و ویژگی‌های مارک‌داون است. این مجموعه برای برنامه‌نویسان، بلاگرها و هر کسی که می‌خواهد متون خود را به صورت شکیل و تمیز فرمت کند، بسیار مفید و کاربردی است. یادگیری مارک‌داون به شما کمک می‌کند تا مستندات و متون خود را به راحتی و با کیفیت بالا ایجاد کنید.

📱 GitHub Repo
مرجع دیتاست فارسی

27 Jan, 05:34

1,900

🔍 شناسایی اخبار جعلی فارسی:

این مخزن شامل مجموعه داده‌ای از اخبار جعلی به زبان فارسی است که به منظور شناسایی و تمایز اخبار واقعی از جعلی در رسانه‌ها و شبکه‌های اجتماعی ایجاد شده است. از طریق این مجموعه، پژوهشگران و توسعه‌دهندگان می‌توانند الگوریتم‌ها و مدل‌های یادگیری ماشین خود را برای تشخیص اخبار تقلبی بهبود بخشند.

📚 کاربردها:
- پروژه‌های یادگیری ماشین: آموزش مدل‌ها برای تشخیص و طبقه‌بندی اخبار جعلی.
- پردازش زبان طبیعی (NLP): تجزیه و تحلیل متون فارسی و بهبود دقت مدل‌های NLP.
- مطالعات رسانه‌ای: بررسی و تحلیل صحت اخبار منتشر شده در رسانه‌های فارسی‌زبان.

از این مجموعه داده می‌توان برای بهبود امنیت اطلاعات و جلوگیری از انتشار اطلاعات نادرست در جامعه استفاده کرد.

📱 GitHub Repo
مرجع دیتاست فارسی

25 Jan, 05:34

1,686

مجموعه ابزار قدرتمند برای پردازش و کار با متن‌های فارسی! با استفاده از این کتابخانه، شما می‌توانید به راحتی و به صورت کارآمد متن‌های فارسی را مورد پردازش قرار دهید. این ابزارک‌ها شامل قابلیت‌هایی نظیر توکنایز کردن، نرمال‌سازی، ریشه‌یابی و سایر عملیات مرتبط با زبان فارسی هستند که می‌تواند در پروژه‌های NLP و متن‌کاوی به شما کمک کند. با استفاده از این کتابخانه، فرآیند پردازش زبان فارسی در پروژه‌های خود را سریع‌تر و دقیق‌تر کنید.

📱 GitHub Repo
مرجع دیتاست فارسی

20 Jan, 05:34

1,834

این ابزار وب‌کِرولِر فارسی برای جمع‌آوری اطلاعات از وبسایت‌های مختلف فارسی طراحی شده‌است. Persian Web Scraper با تمرکز بر زبان فارسی به شما کمک می‌کند تا داده‌های مورد نیاز خود را به صورت سریع و کارآمد استخراج کنید. این ابزار می‌تواند در پروژه‌های داده‌کاوی، تحلیل محتوا و سایر بررسی‌های مبتنی بر داده‌های اینترنتی مورد استفاده قرار گیرد.

📱 GitHub Repo
مرجع دیتاست فارسی

18 Jan, 05:34

1,752

این نوت‌بوک جالب در لینک ارائه‌شده، شامل کدها و توضیحات کاربردی برای یادگیری مبانی پایتون است. مجموعه‌ای از مثال‌های ساده و قابل فهم که به شما کمک می‌کند تا مهارت‌های برنامه‌نویسی خود را افزایش دهید. اگر در حال شروع یادگیری پایتون هستید یا نیاز به مرور مفاهیم پایه دارید، این نوت‌بوک می‌تواند بهترین مرجع برای شما باشد. ضمناً، از این نوت‌بوک می‌توانید در محیط‌های آموزشی و دوره‌های برنامه‌نویسی بهره ببرید.

📱 GitHub Repo