خانه / کلان داده / مفاهیم پایه

مفاهیم پایه

مفاهیم پایه حوزه کلان داده

بیگ دیتا چیست ؟ – اینفوگرافیک

دوازدهمین شماره نشریه ایست رسانه ای با موضوع بیگ دیتا یا کلان داده، توسط فرهنگسسرای رسانه و شبکه های اجتماعی، منتشر شد. به گزارش روابط عمومی فرهنگسرای رسانه و شبکه‌های اجتماعی، داده‌های بزرگ یا کلان داده ترجمه اصطلاح Big Data است که معمولا به مجموعه‌ای از داده‌ها اطلاق می‌شود که ...

ادامه مطلب »

معیارهایی برای انتخاب نوع فایل در پردازش‌های کلان داده

مقدمه بعد از حدود ۱۳ سال از معرفی هدوپ به عنوان اولین سامانه عمومی پردازش کلان داده، این اکوسیستم به بلوغ رسیده است به گونه‌ای که امروز با معرفی نسخه ۳ هدوپ، بسیاری از اشکالات و نواقص آن برطرف شده است. در این بین، نحوه ذخیره فایلها در اکوسیستم هدوپ ...

ادامه مطلب »

مقدمه ای بر کلان داده – بیگ دیتا چیست ؟

۱-    مقدمه بیگ دیتا یا کلان داده چندسالیست که در ادبیات فناوری اطلاعات به یک اصطلاح فراگیر تبدیل شده است و در این مقاله سعی شده است، این حوزه نوین، به صورت اجمالی معرفی گردد. اگر بخواهیم تعریفی از کلان داده ارائه کنیم می توانیم آنرا مجموعه داده‌هایی بدانیم که ...

ادامه مطلب »

پرونده ویژه کلان داده در نشریه دانشجویی اف وان

نشریه اف وان به عنوان نشریه شاخه دانشجویی ACM‌ دانشگاه تهران ، در نسخه جدید خود به موضوع داده های بزرگ و یا کلان داده پرداخته است. در وب سایت این نشریه این توضیحات را با حال و هوای دانشجویی می توانید مشاهده کنید : فصل‌نامه‌ی دانش‌جویی اف‌یک حدود چهار ...

ادامه مطلب »

SVM یا ماشین بردار پشتیبان به زبان ساده

دسته بند بردار پشتیبان

یکی از الگوریتم ها و روشهای بسیار رایج در حوزه دسته بندی داده ها، الگوریتم SVM یا ماشین بردار پشتیبان است که در این مقاله سعی شده است به زبان ساده و به دور از پیچیدگیهای فنی توضیح داده شود. آشنایی با مفهوم دسته بندی فرض کنید مجموعه داده ای ...

ادامه مطلب »

اسپارک : موتور نوین پردازش کلان داده

چند صباحیست که در دنیای کلان داده، سامانه پردازش جدیدی پا به عرصه وجود نهاده است با نام اسپارک که امروزه یکی از فعالترین پروژه های بنیاد آپاچی است. تا قبل از اسپارک، برای پردازش حجم عظیم داده ها از هدوپ به صورت معمول استفاده میشد و همانطور که احتمالاً ...

ادامه مطلب »

ظهور استاندارد در حوزه کلان داده

استانداردهای کلان داده

مرکز ملی استاندارد آمریکا ، اخیرا استاندارد سازی در حوزه مهندسی داده و بویژه کلان داده را شروع کرده است و رسما در هفت حوزه  زیر از فعالان و صاحبنظران درخواست کرده است که مطالب و نقطه نظرات خود را برای آنها ارسال کنند. این هفت حوزه عبارتند از : ...

ادامه مطلب »

سيستم‌هاي فايلي در عصر کلان داده

فناوري و دانشي را در نظر بگيريد که در پس زمينه صفحه اصلي موتور جست‌وجوي گوگل مورد استفاده قرار مي‌گيرد. در پس الگوريتم‌ها و ساير قابليت‌هايي که امکان جست‌وجو بر مبناي متن وارد شده را فراهم مي آورد، يک مرکز داده بزرگ نيز وجود دارد. در اين مرکز داده،کپي متني ...

ادامه مطلب »