‍ آینده مهندسی داده از نگاه نتفلیکس، Airbnb و Databricks 🚀

۰ 78 زمان تقریبی مطالعه 2 دقیقه

📌 اوایل خرداد، نتفلیکس در رویداد سالانه‌ی خود یعنی Data Engineering Open Forum 2025، پنلی جذاب با عنوان «آینده مهندسی داده» برگزار کرد که در آن سه متخصص از غول‌های فناوری دیدگاه‌های‌شان را درباره آینده این حوزه به اشتراک گذاشتند.

🔸 Tikica (مدیر پنل – مهندس ارشد نتفلیکس)

🔸 Ryan Blue (هم‌بنیان‌گذار Databricks و سازنده Iceberg)

🔸 Jerry (مهندس ارشد Airbnb)

🔸 Ena (مهندس داده در نتفلیکس)

🎥 ویدئوی ۲۰ دقیقه‌ای این پنل:

https://www.youtube.com/watch?v=VVWjdsuNrwE&ab_channel=NetflixEngineering

The Future of Data Engineering | Data Engineering Open Forum 2025

This talk is a part of the Data Engineering Open Forum 2025 at Netflix. Speakers: Inna Giguere, Director, Content and Studio Data Engineering at Netflix Ryan Blue, Technical Staff at Databricks Jerry Wang, Data Infrastructure Senior Leader at Airbnb Moderated by Tulika Bhatt, Senior Software Engineer at Netflix — If you are interested in attending a future Data Engineering Open Forum, we highly recommend you join our Google Group (https://groups.google.com/g/data-engineering-open-forum) to stay tuned to event announcements.

https://www.youtube.com/watch?v=VVWjdsuNrwE

در این پنل، از مسیرهای شغلی تا چالش‌های امروز و مهارت‌های فردا صحبت شد. خلاصه‌ای از نکات مطرح‌شده را در ادامه می‌خوانید:

🔮 ۱. هوش‌مصنوعی؛ دستیار قدرتمند، نه تهدید

💬 برخلاف تصور رایج، #GenAI شغل مهندس داده را تهدید نمی‌کند، بلکه ابزار توانمندی برای کمک در کارهای پیچیده و تکراری‌ست:

✅ بازنویسی کوئری و کمک در مهاجرت

✅ بهبود مستندسازی و تسهیل پلتفرم

✅ تمرکز بیشتر بر حل مسائل کسب‌وکار

✅ ارتقاء کیفیت کد

🔍 اما این تحولات، نیاز به داده‌ی باکیفیت، مستند و شفاف را دوچندان می‌کند.

⚠️۲. چالش‌های فعلی در مهندسی_داده

مهندسی داده دیگر فقط ساختن چند جدول و اجرای ETL نیست.

با رشد داده‌ها، ابزارها و انتظارات، چالش‌ها هم رشد کرده‌اند:

🚨 بررسی مشکلات کیفی در داده‌هایی که وارد مدل‌های LLM می‌شوند بسیار سخت‌تر است. برخلاف داشبورد یا A/B تست‌ها، این مدل‌ها شفاف نیستند.

🌐 اتصال بین انباره‌های داده آفلاین، آنلاین و اپلیکیشن‌های واقعی محصول‌محور، باعث شده دیتاپایپ‌لاین‌ها بسیار پیچیده‌تر شوند.

🛡 نگرانی‌های جدیدی درباره‌ی حریم خصوصی، لو رفتن اطلاعات حساس و نحوه‌ی کنترل داده‌های تولیدشده توسط LLMها شکل گرفته است.

🎥 مهاجرت به داده‌های چندرسانه‌ای (متن، تصویر، ویدیو) نیاز به مهارت و ابزارهایی دارد که خیلی از ما هنوز با آنها آشنا نیستیم.

🧠 ۳. مهارت‌های کلیدی برای آینده

پنلیست‌ها تاکید کردند که مسیر موفقیت همچنان از «پایه‌های مهندسی قوی» می‌گذرد:

📌 مدل‌سازی دقیق داده

📌 درک ساختارها

📌 تعهد به کیفیت

اما برای آینده، باید مهارت‌های زیر را نیز توسعه داد:

🔹 پردازش real-time و event-driven

🔹 آشنایی با جستجوی معنایی و vector DBها

🔹 توانایی پردازش داده‌های multimodal

🔹 یادگیری ابزارهای مدرن مانند DBT، DuckDB، PyIceberg و…

🧭 ۴. تشخیص ابزار مفید از ترندهای هیجانی

چطور بین ابزارهای واقعی و ترندهای زودگذر فرق بگذاریم؟

پنل نکات خوبی درباره‌ی انتخاب تکنولوژی مناسب داشت:

✅ آیا این ابزار واقعاً کار ما را ساده‌تر می‌کند؟

✅ فقط نحوه‌ی استفاده‌اش را بلدم یا می‌دانم چرا و چطور کار می‌کند؟

✅ آیا جامعه‌ توسعه‌دهنده و کامیونیتی فعالی دارد؟

✅ آیا به نیاز واقعی بیزینس پاسخ می‌دهد؟

📌 جمع‌بندی

آینده‌ی مهندسی داده، ترکیبی‌ست از پایه‌های محکم فنی و یادگیری هوشمندانه‌ی ابزارهای جدید.

اگر هوشمند انتخاب کنیم و یاد بگیریم، GenAI حامی ماست، نه جایگزین ما.

برچسب ها

مجتبی بنائی 1404/04/13

۰ 78 زمان تقریبی مطالعه 2 دقیقه

بعدی را بخوانید

‍ آینده مهندسی داده از نگاه نتفلیکس، Airbnb و Databricks 🚀

🔮 ۱. هوش‌مصنوعی؛ دستیار قدرتمند، نه تهدید

⚠️۲. چالش‌های فعلی در مهندسی_داده

🧠 ۳. مهارت‌های کلیدی برای آینده

🧭 ۴. تشخیص ابزار مفید از ترندهای هیجانی

📌 جمع‌بندی

مجتبی بنائی

بعدی را بخوانید

معرفی یک مخزن کد کاربردی برای رهبران تیم‌های دیتا

بحران پیچیدگی در معماری داده‌های مدرن: از چالش‌ها تا راهکارهای عملی

بحران پنهان مهندسی داده: چرا کمبود متخصصان این حوزه زنگ خطر بزرگی است؟

JuiceFS: راهکار مدرن برای ذخیره‌سازی توزیع‌شده داده

معرفی یک مخزن کد کاربردی برای رهبران تیم‌های دیتا

بحران پیچیدگی در معماری داده‌های مدرن: از چالش‌ها تا راهکارهای عملی

بحران پنهان مهندسی داده: چرا کمبود متخصصان این حوزه زنگ خطر بزرگی است؟

JuiceFS: راهکار مدرن برای ذخیره‌سازی توزیع‌شده داده

دیدگاهتان را بنویسید لغو پاسخ

🔮 ۱. هوش‌مصنوعی؛ دستیار قدرتمند، نه تهدید

⚠️۲. چالش‌های فعلی در مهندسی_داده

🧠 ۳. مهارت‌های کلیدی برای آینده

🧭 ۴. تشخیص ابزار مفید از ترندهای هیجانی

📌 جمع‌بندی

مجتبی بنائی

بعدی را بخوانید

معرفی یک مخزن کد کاربردی برای رهبران تیم‌های دیتا

بحران پیچیدگی در معماری داده‌های مدرن: از چالش‌ها تا راهکارهای عملی

بحران پنهان مهندسی داده: چرا کمبود متخصصان این حوزه زنگ خطر بزرگی است؟

JuiceFS: راهکار مدرن برای ذخیره‌سازی توزیع‌شده داده

معرفی یک مخزن کد کاربردی برای رهبران تیم‌های دیتا

بحران پیچیدگی در معماری داده‌های مدرن: از چالش‌ها تا راهکارهای عملی

بحران پنهان مهندسی داده: چرا کمبود متخصصان این حوزه زنگ خطر بزرگی است؟

JuiceFS: راهکار مدرن برای ذخیره‌سازی توزیع‌شده داده

با عضویت در خبرنامه ما

آخرین مطالب سایت را سریع تر از دیگران دریافت کنید

داستان تولد یک Graph Engine متفاوت: آشنایی با PuppyGraph

معرفی یک مخزن کد کاربردی برای رهبران تیم‌های دیتا

دیدگاهتان را بنویسید لغو پاسخ