Data Science | علم داده (@datascience_ir) के नवीनतम पोस्ट टेलीग्राम पर

Data Science | علم داده टेलीग्राम पोस्ट

Data Science | علم داده
📊 دانشمند داده شوید!
👔 جهت درج تبلیغات، به آیدی زیر پیام دهید:👇🏼‌

🆔 @DataScienceir_Adv
51,176 सदस्य
442 तस्वीरें
192 वीडियो
अंतिम अपडेट 01.03.2025 07:19

Data Science | علم داده द्वारा टेलीग्राम पर साझा की गई नवीनतम सामग्री


🗂 10 نمونه «پورتفولیوی واقعی علوم داده» برای الهام گرفتن!


👩🏻‍💻 بارها گفتم؛ یه رزومه‌ی قوی یعنی داشتن پروژه‌های واقعی، نه فقط یه لیست از مهارت‌ها! چه دنبال کار تو حوزه علوم داده باشین، چه پروژه‌‌های فریلنسری، یه پورتفولیوی قوی و ساختاریافته بهترین تبلیغ از خودتونه!

❗️ یادتون باشه شرکت‌ها دنبال کسی‌ان که بتونه داده‌های خام رو به تحلیل‌های کاربردی تبدیل کنه، نه اینکه فقط یه سری مهارت و مباحث تئوری رو بلد باشه!

📁 من ۱۰ پورتفولیوی برتر از حرفه‌ای‌های دنیای علوم داده رو اینجا آوردم، که هر کدومشون یه مسیر خاصی رو طی کردن! این ده تا رو ببینید و ازشون الهام بگیرید تا بتونین یه پوتفولیوی قوی برای خودتون بسازین!👇



1️⃣ پورتفولیوی Ken Jee | دانشمند داده

▶️ حوزه: تحلیل داده‌های ورزشی

👤 لینک: Portfolio


2️⃣ پورتفولیوی Yassine Alouini | استاد کگل

▶️ حوزه: یادگیری ماشین و رقابت‌های کگل

👤 لینک: Portfolio


3️⃣ پورتفولیوی Tatman | دانشمند داده

▶️ حوزه: پردازش زبان طبیعی (NLP)

👤 لینک: Portfolio


4️⃣ پورتفولیوی Robinson | دانشمند داده

▶️ حوزه: تحلیل آماری و برنامه‌نویسی R

👤 لینک: Portfolio


5️⃣ پورتفولیوی Siraj Raval | مدرس AI

▶️ حوزه: یادگیری ماشین و هوش مصنوعی

👤 لینک: Portfolio


6️⃣ پورتفولیوی Julia Silge | دانشمند داده

▶️ حوزه: داده‌های مرتب و بصری‌سازی داده

👤 لینک: Portfolio


7️⃣ پورتفولیوی Mueller |دولوپر Scikit-Learn

▶️ حوزه: یادگیری ماشین و پروژه‌های متن‌باز

👤 لینک: Portfolio


8️⃣ پورتفولیوی Wickham | دیتا ساینتیست

▶️ حوزه: برنامه‌نویسی R و بصری‌سازی داده

👤 لینک: Portfolio


9️⃣ پورتفولیوی François Puget | استاد کگل

▶️ حوزه: تکنیک‌های پیشرفته یادگیری ماشین

👤 لینک: Portfolio


🔟 پورتفولیوی Emily | تحلیلگر داده در دیزنی

▶️ حوزه: بصری‌سازی و داستان‌سرایی با داده

👤 لینک: Portfolio


📂 فایل خلاصه هر پورتفولیو: PDF



🌐 #علم_داده #DataScience

📊 دانشمند داده شوید :
📊 @DataScience_ir
📱 پیج اینستاگرام:
📊 @DataScience_fa

تیم من ۱۳۷ ساعت وقت گذاشت و 1000+ کتابخونه پایتون رو بررسی کرد— اینا اون جواهرای مخفی‌ای هستن که باید بشناسی!


👨🏻‍💻 من ۱۷ ساله توی حوزه علوم داده کار می‌کنم و می‌دونم که ابزارهای درست، چقدر می‌تونن کارت رو راحت‌تر کنن. این لیست بهترین کتابخونه‌های پایتون رو آماده کردم که کمتر دیده شدن، ولی خودشون هرکدوم یه غول واقعی‌ان!👇



🏳️‍🌈 کتابخونه Science Plots

✏️ یه پوسته حرفه‌ای برای Matplotlib که خروجی گراف‌هات رو برای مقالات و تحقیقات، حسابی شیک و رسمی می‌کنه.


🏳️‍🌈 کتابخونه CleverCSV

✏️ مشکلات پردازش CSV (خطای CSV Parsing) تو Pandas اعصاب‌تو خورد کرده؟ این کتابخونه تو چند ثانیه حلش می‌کنه!


🏳️‍🌈 کتابخونه fastparquet

✏️ ورودی/خروجی فرمت Parquet تو Pandas رو تا ۵ برابر سریع‌تر کن!


🏳️‍🌈 کتابخونه Drawdata

✏️ داده‌های دو بُعدی رو مستقیم تو Jupyter با موس بکش و ایجاد کن!


🏳️‍🌈 کتابخونه nbcommands

✏️ دیگه نیاز نیست تو Jupyter Notebook اسکرول کنی تا یه سلول خاص رو پیدا کنی، مستقیم جستجو کن.


🏳️‍🌈 کتابخونه Aquarel

✏️ یه استایل حرفه‌ای و خاص برای نمودارهای Matplotlib بساز! (نمودارهاتو خوشگل‌تر کن!).


🏳️‍🌈 کتابخونه Uniplot

✏️ نمودارها رو مستقیماً تو ترمینال و با Unicode رسم کن! (خیلی سبک و سریع)


🏳️‍🌈 کتابخونه pydbgen

✏️ دیتافریم‌های تصادفی تو Pandas بساز، خیلی کاربردیه برای تست الگوریتم‌ها.


🏳️‍🌈 کتابخونه modelstore

✏️ نسخه‌های مختلف مدل‌های یادگیری ماشین رو پیگیری و ذخیره کن.


🏳️‍🌈 کتابخونه Pigeon

✏️ داده‌ها رو تو Jupyter با چند کلیک برچسب‌گذاری (Annotation) کن، بدون دردسر!


🏳️‍🌈 کتابخونه Optuna

✏️ بهینه‌سازی هایپرپارامترها رو راحت و سریع انجام بده.


🏳️‍🌈 کتابخونه Pampy

✏️ الگوهای کد رو سریع و ساده پیدا کن!


🏳️‍🌈 کتابخونه KnockKnock

✏️ وقتی آموزش مدلت تموم شد، خودش بهت نوتیفیکیشن میده، دیگه نیازی نیست دستی چک کنی!


🏳️‍🌈 کتابخونه Gradio

✏️ یه رابط کاربری شیک و ساده برای مدل‌های یادگیری ماشینت بساز.


🏳️‍🌈 کتابخونه handcalcs

✏️ فرمول‌های ریاضی رو مستقیماً تو Jupyter نمایش بده!


🏳️‍🌈 کتابخونه Osquery

✏️ با SQL، داده‌های سیستم‌عاملتو بررسی کن!


🏳️‍🌈 کتابخونه D3Blocks

✏️ نمودارهای تعاملی رو مستقیماً به صورت HTML خروجی بگیر.


🏳️‍🌈 کتابخونه Data Copilot

❗️ حوصله نداری ۱۸ تا کتابخونه رو نصب کنی؟ این یه کتابخونه، همه این قابلیت‌ها رو یکجا داره!


پشتیبانی از زبان طبیعی برای نوشتن کدهای پایتون و Pandas.

تولید SQL بدون کدنویسی برای پرس‌وجوهای دیتابیسی.

ادغام با Data Warehouse برای یکپارچه‌سازی راحت‌تر.

اصلاح خودکار ارورها.



🌐 #علم_داده #DataScience

📊 دانشمند داده شوید :
📊 @DataScience_ir
📱 پیج اینستاگرام:
📊 @DataScience_fa

📖 جزوه «ساختمان داده‌ و الگوریتم‌ها»
💻 برای علوم داده


👨🏻‍💻 اگه قصد دارین تو یکی از شاخه‌های دیتا ساینس، مهندسی داده یا تحلیل داده کار کنین، تسلط روی ساختارهای داده و الگوریتم‌ها (DSA) می‌تونه یه برگ برنده اساسی براتون باشه.💯


✏️ چرا DSA انقدر برای علم داده مهمه؟

پردازش بهینه داده‌ها: وقتی با حجم بالایی از دیتا سروکار داری، لازمه الگوریتم‌های بهینه رو بشناسی.

عملکرد بهتر: هر چقدر کدت بهینه‌تر باشه، زمان پردازش کمتر و مقیاس‌پذیری سیستم بیشتر می‌شه.

تقویت مهارت حل مسئله: اکثر چالش‌های واقعی دنیای داده، نیاز به تفکر الگوریتمی و ساختاری دارن.

موفقیت در مصاحبه‌های فنی: شرکت‌های بزرگ توی مصاحبه‌ها اغلب از مباحث DSA سوال می‌پرسن، به‌ویژه برای موقعیت‌های دیتا.



🌐 #علم_داده #DataScience

📊 دانشمند داده شوید :
📊 @DataScience_ir
📱 پیج اینستاگرام:
📊 @DataScience_fa

🚀 بهینه‌سازی مصرف حافظه در پایتون با slots


👩🏻‍💻 آبجکت‌های پایتون معمولاً حافظه زیادی مصرف می‌کنن چون انعطاف بالایی در ذخیره ویژگی‌ها دارن. اما یه ترفند ساده وجود داره که می‌تونه این مصرف حافظه رو کاهش بده:

✏️ استفاده از __slots__ باعث می‌شه فضای حافظه برای ویژگی‌ها از قبل رزرو بشه و بهینه‌تر عمل کنه.


🔎 توی یه تست ساده (عکس بالا)، با __slots__ مصرف حافظه رو حدود 11.1 مبی‌بایت کاهش دادیم! این یعنی بهینه‌سازی قوی برای برنامه‌هایی که با حجم بالای داده کار می‌کنن.


▶️ slots
🖥 Documents
🖥 Python slots (Fa)
🖥 Python slots (En)



🌐 #علم_داده #DataScience

📊 دانشمند داده شوید :
📊 @DataScience_ir
📱 پیج اینستاگرام:
📊 @DataScience_fa

🗂 همه‌ی دستورات ضروری NumPy
برای علم داده و یادگیری ماشین!


👩🏻‍💻 کتابخونه NumPy یکی از مهم‌ترین کتابخونه‌ها برای کار روی پروژه‌های علم داده و یادگیری ماشینه. این چیت‌شیت رو تهیه کردم تا مهم‌ترین دستورات NumPy رو براتون خلاصه کنم.


📥 دانلود نسخه با کیفیت‌تر: NumPy



🌐 #علم_داده #DataScience

📊 دانشمند داده شوید :
📊 @DataScience_ir
📱 پیج اینستاگرام:
📊 @DataScience_fa

📖 یادگیری «جبر خطی کاربردی»
با کتاب فوق‌العاده دانشگاه استنفورد!


👨🏻‍💻 اگه به علم داده، یادگیری ماشین یا هوش مصنوعی علاقه داری باید بردارها، ماتریس‌ها و حداقل مربعات (Least Squares) رو مثل آب خوردن بلد باشی!

🔔 چرا این کتاب یه انتخاب عالیه؟

1️⃣ همه‌چی رو عمیق ولی ساده توضیح داده!
2️⃣ پر از کاربردهای عملی؛ از ML تا AI
3️⃣ تسلط روی Least Squares – که ستون فقرات علم داده مدرنه!
4️⃣ هم برای مبتدی‌ها مناسبه، هم حرفه‌ای‌ها.


🚨 اگه داده‌ها رو تحلیل می‌کنی، پورتفولیو بهینه‌سازی می‌کنی یا مدل‌های هوش مصنوعی می‌سازی، این کتاب ابزارهای ریاضی مورد نیازت رو بهت می‌ده!



🌐 #علم_داده #DataScience

📊 دانشمند داده شوید :
📊 @DataScience_ir
📱 پیج اینستاگرام:
📊 @DataScience_fa

💣 یه جایگزین خفن برای Jupyter Notebook پیدا کردم!

💯 اُپن سورسه و تا الان بیش‌تر از ۱۰ هزار ستاره توی گیت‌هاب گرفته!


👨🏻‍💻 ابزار Marimo ترکیبی از Jupyter, Streamlit, ipywidgets و کلی قابلیت خفن دیگه رو تو خودش داره. حتی می‌تونی باهاش دیتافریم‌های Pandas رو به‌ صورت تعاملی ببینی و روشون با SQL کوئری بزنی!


✔️ ویژگی‌های کلیدی marimo:

🔢 اجرای واکنشی (Reactive Execution): یه سلول رو تغییر بدی، بقیه خودشون آپدیت می‌شن. دیگه لازم نیست دستی اجراشون کنی!

🔢 بدون حالت مخفی (No Hidden State): هر بار که اجراش می‌کنی، نتیجه همونه! دیباگ کردن راحت‌تر از همیشه.

🔢 تعامل بدون دردسر: اسلایدر، جدول، نمودار... هر چی بخوای، بدون Callback و دردسر!

🔢 یه اسکریپت خالص پایتون: با CLI پارامتریزش کن یا حتی به‌عنوان یه اپلیکیشن اجراش کن.

🔢 سازگار با گیت (Git-friendly): دیگه خبری از فایل‌های JSON عجیب‌غریب نیست، فقط .py


🟣 marimo
💰 marimo.io
🐱 GitHub-Repos



🌐 #علم_داده #DataScience

📊 دانشمند داده شوید :
📊 @DataScience_ir
📱 پیج اینستاگرام:
📊 @DataScience_fa

📚 کتاب‌هایی که من در حوزه دیتا خوندم!


👨🏻‍💻 تو این چند سالی که وارد حوزه‌‌ی دیتا شدم، با وسواس بسیار بالایی موضوعات مختلفی رو انتخاب و مطالعه کردم.

📄 توی این جزوه اسم هر کدوم از کتاب‌ها رو همراه با یک توضیح بسیار مختصر آماده کردم. این کتاب‌ها، از علم داده شروع می‌شن و عناوینی از دنیای مهندسی داده، نرم‌افزار، رایانش ابری و در نهایت MLOps رو شامل می‌شن.



🌐 #علم_داده #DataScience

📊 دانشمند داده شوید :
📊 @DataScience_ir
📱 پیج اینستاگرام:
📊 @DataScience_fa

📂 تجربه من از بررسی 101 فرصت شغلی در حوزه علوم داده

این مهارت‌ها در سال 2025 بیشترین تقاضا رو دارن!


👩🏻‍💻 چند وقت پیش داشتم آگهی‌های شغلی علم داده‌ رو تحلیل می‌کردم، یه سری الگوهای جالب دیدم که فکر کردم خیلی می‌تونن کمک‌کننده باشه، (چه برای تازه‌واردها و چه برای حرفه‌ای‌ها) و تصمیم گرفتم این دیتا رو باهاتون به اشتراک بذارم:


🔢 پایتون همچنان پادشاهه!👑


🔎 86% از آگهی‌های شغلی به Python اشاره کرده بودن. (یعنی از هر ۱۰ آگهی، ۸ تا صراحتاً Python رو به‌عنوان مهارت ضروری ذکر کرده بودن!).

▶️ پس اگه هنوز یادگیری علوم داده‌ رو شروع نکردی، اول از همه پایتون رو یاد بگیر!


✏️ تجربه شخصی من؟

📄 من خودم قبل از اینکه اولین پیشنهاد کار علم داده‌م رو بگیرم، با DataCamp پایتون رو یاد گرفتم و خیلی توصیه‌ش می‌کنم! دوره‌اش هم رایگانه.😌👌🏼

📌 منبع یادگیری پیشنهادی من



🔢 زبان SQL و R هم جز مهارت‌های ضروری هستن!


🔎 62% از موقعیت‌های شغلی SQL رو نیاز داشتن.

🔎 50% از اون‌ها R رو هم ذکر کرده بودن.

✏️ هر جایی که R نیاز داشت، Python هم جزو مهارت‌های مورد نیازش بود. پس حتی اگه R بلد باشی، لازمه Python رو هم یاد بگیری.

✔️ پس اول پایتون یاد بگیر، بعدش برو سراغ SQL و R تا فرصت‌های بیشتری داشته باشی.



🔢 65% از موقعیت‌ها به یادگیری ماشین اشاره کرده بودن...


💸 ولی جالب اینجاست که هیچ مدل خاصی رو به‌عنوان مهارت ضروری نام نبرده بودن!

✏️ پس چیکار کنیم؟

▶️ به جای اینکه فقط روی مدل‌های پیچیده تمرکز کنی، پایه‌ی آمار و احتمالت رو قوی کن و یادگیری مفاهیم ماشین لرنینگ رو شروع کن.

🔰 آمار، احتمالات، یادگیری نظارت‌شده و غیرنظارت‌ شده، از بخش‌های مهمی هستن که حتما باید روشون مسلط بشی!



🔢 مهارت‌های نرم هم خیلی مهمن!


✏️ توی اکثر آگهی‌های شغلی، درک کسب‌وکار و مهارت‌های ارتباطی هم به‌ عنوان الزامات اصلی ذکر شده بودن.

❗️ پس فقط کدنویسی کافی نیست! باید بتونی داده‌ها رو به زبون بیزینس تحلیل کنی. اگه نتونی نتایج رو برای تیم محصول یا مدیران توضیح بدی، کارت سخت می‌شه!

👤 من وقتی اولین پیشنهاد کار علم داده رو گرفتم، این کتاب مدیریت محصول رو دو بار خوندم و واقعا بهم کمک کرد!👇

🔗 لینک کتاب پیشنهادی



🔢 40% از موقعیت‌های شغلی مهارت‌های بصری‌سازی داده رو لازم داشتن!


✏️ ولی جالبه که ابزار خاصی مثل Tableau خیلی کم ذکر شده بود. پس به جای تمرکز روی ابزارها، مفاهیم اصلی Data Viz رو یاد بگیر:

✔️ شناخت مخاطبین و هدفت از بصری سازی (چی برای کارفرما مهمه؟)

✔️ تعریف شاخص‌های کلیدی برای کسب‌وکار

✔️ تبدیل نیازهای مبهم محصول به داشبوردهای کاربردی و قابل‌استفاده



✔️ نتیجه نهایی:

📣 اگه می‌خوای توی ۲۰۲۵ یه دانشمند داده موفق باشی، پایتون، SQL، مهارت‌های بصری‌سازی و درک بیزینس رو تو اولویتت بذار!


🥵 پایتون ← SQL ← یادگیری ماشین (مفاهیم پایه‌ای) ← درک کسب‌وکار ← بصری‌سازی داده‌ها

🔗 فایل PDF گزارشم



🌐 #علم_داده #DataScience

📊 دانشمند داده شوید :
📊 @DataScience_ir
📱 پیج اینستاگرام:
📊 @DataScience_fa

🥇 سه دوره رایگان و جامع علوم داده به فارسی
💰 به همراه دوره کوتاه «پایتون برای علم داده»


👨🏻‍💻 جواد وحید دستجردی، سه دوره آموزشی جامع "علم داده، یادگیری ماشین و هوش مصنوعی" به همراه یک دوره کوتاه "پایتون برای علم داده" رو به زبان فارسی و رایگان در کانال آپاراتش منتشر کرده است.


🔢 دوره‌ علم داده شامل 25 ویدیوی آموزشی و بدون هیچ پیش نیازی هست.


🔢 دوره یادگیری ماشین شامل 100 ویدیوی آموزشی و بر اساس بر اساس سرفصل های "دوره ماشین لرنینگ آقای Andrew Ng" هست.


🔢 دوره هوش مصنوعی نیز شامل 28 ویدیوی آموزشی و بر اساس سرفصل های دوره "هوش مصنوعی برای همه" آقای Andrew Ng هست.


🔰 برای دسترسی به این دوره‌های جامع و فوق العاده، می تونین از لینک‌های زیر استفاده کنین.👇


📄 لیست دوره‌های رایگان علوم داده
◼️ دوره علـم داده
◻️ دوره یـادگیـری ماشیـن
◼️ دوره هـوش مصـنوعی
◻️ دوره پـایتون بـرای علـم داده



🌐 #علم_داده #DataScience

📊 دانشمند داده شوید :
📊 @DataScience_ir
📱 پیج اینستاگرام:
📊 @DataScience_fa