ابزار و کتابخانه ها
-
اسفند- ۱۴۰۳ -۳۰ اسفند
🚀 آیا Apache Spark در حال نابودی است؟ بیایید صحبت کنیم
امروزه گزینههای بسیار متنوعی برای پردازش دادههای حجیم علاوه بر اسپارک در دسترس ماست، و این وظیفهی مهندسین داده است…
بیشتر بخوانید » -
۳۰ اسفند
🚖 چگونه Uber با ترکیب Apache Spark و Ray، عملکرد سیستم خود را بهبود داد؟
در این مطلب، بررسی میکنیم که Uber چگونه با ترکیب Apache Spark و Ray، سرعت اجرای برخی از فرآیندهای پردازش…
بیشتر بخوانید » -
۲۹ اسفند
به بهانه انتشار نسخه ۴ آپاچی کافکا
همزمان با فرا رسیدن سال جدید شمسی، نسخه Apache Kafka 4.0 منتشر شد و جامعه توسعهدهندگان بالاخره شاهد نهایی شدن…
بیشتر بخوانید » -
۲۸ اسفند
نگاهی به خرید HyperDX توسط کلیکهوس
امروزه، تیمهای مهندسی داده و دواپس برای نظارت جامع بر سامانههای خود به پلتفرمهایی نیاز دارند که متریکها، لاگها، تریسها…
بیشتر بخوانید » -
۱۰ اسفند
پردازش توزیع شده با DuckDB
در دنیای هوش مصنوعی، نام DeepSeek این روزها بیش از پیش شنیده میشود. شرکتی که با مدلهای قدرتمند خود توانسته…
بیشتر بخوانید » -
دی- ۱۴۰۳ -۲۱ دی
JuiceFS: راهکار مدرن برای ذخیرهسازی توزیعشده داده
انتخاب یک راهکار مقیاسپذیر و کارآ برای ذخیره توزیع شده فایلها در بسیاری از معماریهای امروزی سیستمهای اطلاعاتی یک تصمیم…
بیشتر بخوانید » -
آبان- ۱۴۰۳ -۴ آبان
۱۵ مخزن گیتهاب ضروری برای مهندسی(ن) داده
اگر به دنبال تقویت مهارتهای مهندسی داده خود هستید، بررسی و مرور مخازن کد مرتبط با مهندسی داده و پروژههای…
بیشتر بخوانید » -
مهر- ۱۴۰۳ -۲۸ مهر
نگاهی به قالبهای جدید ذخیره دادهها (به صورت خام)
با گسترش مفاهیمی مانند LakeHouse ها و استانداردهایی مانند IceBerg و تسهیل امکان اجرای کوئری بر روی فایلهای داده پردازش…
بیشتر بخوانید » -
اردیبهشت- ۱۴۰۳ -۱۰ اردیبهشت
معرفی Apache XTable
آپاچی Xtable ابزاری برای تبدیل قالب فایلهای داده در Lakehouse است که به کمک آن، نگرانی سازمانها در انتخاب قالب…
بیشتر بخوانید » -
مهر- ۱۴۰۱ -۲ مهر
ابزارهای نوین پردازش داده در یک نگاه – معرفی سایت OSS Insight
اغلب ابزارهای نوین پردازش داده، متن باز بوده و در گیتهاب حضور فعالی دارند. سایت OSS Insight این فعالیت ها…
بیشتر بخوانید »