خانه / کلان داده (صفحه 3)

کلان داده

فناوریها و مقالات حوزه کلان داده

شروع کار با اسپارک : راه اندازی محیط کار

آموزش اسپارک

اسپارک به عنوان یک جایگزین برای روش سنتی توزیع و تجمیع (MapReduce) در هدوپ، به موتور اصلی پردازش داده های حجیم در اکوسیستم های مبتنی بر کلان داده تبدیل شده است . البته شاید برای بعضی کاربردهای خاص که داده های بسیار حجیم و غیر قابل بارگذاری در حافظه دارند، ...

ادامه مطلب »

معرفی سایت : PredictiveAnalyticsToday مرجع نرم افزارها و خدمات حوزه پردازش و تحلیل داده

حوزه تحلیل و پردازش داده ها امروزه به قدری وسیع و متنوع شده است که انتخاب یک نرم افزار  در این حوزه، خود به یک تخصص و احاطه نسبی نیاز دارد . از طرفی، سرویس های مختلفی که برپایه رایانش ابری و بر روی اینترنت برای تحلیل و پردازش داده ...

ادامه مطلب »

آپاچی Mesos : چارچوبی برای ساخت سامانه های توزیع شده

آپاچی Mesos

در این اپیزود که درآگوست ۲۰۱۵ منتشر شده است، جف میرسون با بنجامین هایندمن مصاحبه می‌کند. بنجامین، همکار در تولید Apache Mesos بوده که یک پروژه متن باز است کهCPU، حافظه، فضای ذخیره‌سازی و دیگر منابع کامپیوتر را از ماشین انتزاع می‌کند و این امکان را فراهم می‌کند که سیستم‌‌های ...

ادامه مطلب »

پردازش یک میلیارد داده تاکسی های نیویورک

وبلاگ marksblogg اخیراً مجموعه مقالاتی را منتشر کرده است در خصوص پردازش داده های مسیرهای طی شده توسط تاکسی های نیویورک در شش سال گذشته که بالای یک میلیارد رکورد را شامل می شود. کار بسیار خوبی که نویسنده مقاله انجام داده است، اجرای چند کوئری مشخص روی معماری ها ...

ادامه مطلب »

نگاهی مقایسه ای به پروژه های پردازش جریان آپاچی

در حوزه پردازش داده، دو نوع اصلی پردازش داریم : پردازش بلادرنگ (Real Time) یا همان پردازش جریان (Stream Processing) و پردازش انبوه (Batch Processing) که فناوریهای اصلی حوزه کلان داده ، مانند روش توزیع و تجمیع (MapReduce)، و جدیدا اسپارک برای پردازش انبوه داده ها طراحی شده اند و ...

ادامه مطلب »

مقدمه ای بر پیکان (Apache Arrow) : تحلیل درون حافظه داده های ستونی

پروژه متن باز پیکان ، علیرغم نوپا بودنش در اکو سیستم آپاچی، در حال تبدیل شدن به یک استاندارد در حوزه پردازش داده و ایجاد یک بستر مناسب برای تعامل بین فناوریهای مختلف کلان داده است. توسعه گران ارشد ۱۳ پروژه متن باز اصلی دنیای کلان داده، یک تیم مشترک ...

ادامه مطلب »

کیودو – لایه ذخیره ساز جدید هدوپ

کیودو (Kudu) به عنوان یک لایه ذخیره ساز جدید و جایگزین HDFS توسط شرکت کلودارا (Cloudera) بعد از سه سال تحقیق و توسعه ، به عنوان یک پروژه متن باز به بنیاد آپاچی پیشنهاد و توسط آپاچی به عنوان یک پروژه نوپا (در حال رشد – incubating) پذیرفته شده است ...

ادامه مطلب »

مجلس گرافی – یک کار مهندسی داده حرفه ای به زبان فارسی

زلیخا گفتن و یوسف شنیدن             شنیدن کی بود مانند دیدن امروزه حرف از مهندسی داده و ضرورت پردازش و استفاده موثر از داده ها به کرات به گوش می خورد اما مثالهای فارسی و بومی که بتوان به علاقه مندان نشان داد که خروجی ...

ادامه مطلب »

آموزش هدوپ از پایه – راه اندازی هدوپ و نصب ابزار لازم

برای آشنایی با جنبه های مختلف سامانه های کلان داده،‌بهتر است به جای خواندن مقالات مختلف و گشت و گذار در اینترنت ، دستها را بالا بزنیم و کار را به صورت عملی فرا بگیریم . سعی داریم از این پس ، به صورت هفتگی یک آموزش عملی از هدوپ ...

ادامه مطلب »

فناوری داده های عظیم و الزامات قانونی آن

مرکز پژوهشهای مجلس در خرداد ماه سالجاری گزارشی را با عنوان فناوری داده های عظیم و الزامات قانونی آن در بیست و چهار صفحه ارائه کرده است که بیشتر مروری است بر الزامات و نیازمندیهای دولت ایران به استفاده از داده ها و فناوریهای نوین پردازشی مرتبط با آن . ...

ادامه مطلب »