نوشته های تازه

نگاهی به تغییرات هدوپ در نسخه ۳ – بخش اول

در ماه های انتهایی سال ۲۰۱۷ بعد از چندین سال کار مداوم، نسخه ۳ هدوپ به صورت رسمی عرضه شد. در این مقاله به قابلیتهای نوین این نسخه از چارچوب پردازشی محبوب کلان داده خواهیم پرداخت. تغییرات اصلی که در این نسخه شاهد هستیم عبارتند از : با هم این ...

ادامه مطلب »

تحلیل رگرسیون

هنگام کار با داده در نرم افزارهای مختلف داده کاوی، وقتی از رگرسیون استفاده می شود، با نتایج زیر روبرو می شویم. در این مقاله قصد داریم به معرفی هر یک از نتایج بپردازیم. باقیمانده ها (Residuals): باقیمانده برابر تفاوت بین مقادیر مشاهده شده و مقادیر پیش بینی شده است. ...

ادامه مطلب »

TiDB جایگزین مقیاس پذیر MySQL

مای اس کیو ال به عنوان دومین بانک اطلاعاتی محبوب و رایج دنیا (بر طبق رتبه بندی سایت DB-Engines)، برای تمامی فعالان حوزه آی تی، کاملاً شناخته شده است. دیتابیسی قدیمی و متن باز که با خریداری شدن مالک اصلی آن یعنی شرکت Sun Microsystems توسط اوراکل، شاهد شکل گیری ...

ادامه مطلب »

آموزش عملی یادگیری ماشین با بستر آموزشی کگل

در مورد کگل در این سایت بارها دست به قلم شده ایم (برجسپ : کگل). سایتی که ابتدا به عنوان یک بستر برگزاری آنلاین مسابقات پردازش داده کاربردی در دنیا پا به عرصه وجود گذاشت و به تدریج امکاناتی مانند مجموعه داده ها، رتبه بندی کاربران، امکان اجرای آنلاین کدهای ...

ادامه مطلب »

آپاچی پولسار : رقیب تازه نفس کافکا

کافکا به عنوان یک سامانه توزیع پیام  مقیاس پذیر، امروزه به یک استاندارد در طراحی سامانه های کلان اطلاعاتی و معماریهای بیگ داده تبدیل شده است. برای ساخت یک خط تولید پردازش داده، داده ها را از منابع مختلف مانند شبکه های اجتماعی، حسگرها، فراخوانی های  API، نقاط مهم در ...

ادامه مطلب »

پستگرس : بانک اطلاعاتی منتخب سال ۲۰۱۷

اگر اخبار دنیای بانک های اطلاعاتی را دنبال می کنید، مطمئنا با پستگرس به عنوان یکی از بانک های اطلاعاتی محبوب در چند سال اخیر آشنا خواهید بود و وب سایت مهندسی داده هم مقالات زیادی راجع به این بانک اطلاعاتی متن باز رایگان و بسیار قدرتمند، منتشر کرده است. ...

ادامه مطلب »

آموزش مقدماتی الاستیک سرچ و کیبانا

همانطور که قبلاً هم در این سایت توضیح داده ام، الاستیک سرچ یکی از بهترین بانکهای اطلاعاتی سندگرا و همچنین جزء بهترین کتابخانه های جستجوی متن است که بر پایه کتابخانه معروف لوسین بنا شده است و علاوه بر سرعت بسیار بالا در پاسخگویی به انواع پرس و جوهای موردنیاز، ...

ادامه مطلب »

یادگیری ماشین – مفاهیم پایه درخت تصمیم #۱

درخت تصمیم چیست؟ در ادامه معرفی الگوریتمهای ضروری یادگیری ماشین، به بررسی مفاهیم پایه درخت تصمیم می پردازیم که یکی از الگوریتم‌ها و روش‌های محبوب در حوزه طبقه‌بندی یا دسته‌بندی داده‌ها، است و در این مقاله سعی شده است به زبان ساده و به‌دوراز پیچیدگی‌های فنی توضیح داده شود. درخت ...

ادامه مطلب »

دورنمای فضای تجاری رایانش ابری ایران

جامعه آزاد رایانش ابری ایران، در بخش طبقه بندی (Taxonomy) سایت خود، اقدام به معرفی شرکتهای فعال در حوزه رایانش ابری کشور نموده است که بسیاری از این شرکتها، خدمات زیرساخت کلان داده هم ارائه می کنند.برای جامعه آزاد رایانش ابری ایران هم آرزوی موفقیت روزافزون و انجام کارهایی حرفه ...

ادامه مطلب »

چگونه بازماندگان شما را فریب می دهند – معرفی سایت آنالیکا

با رشد شبکه های اجتماعی تلفن همراه در کشور و بخصوص با راه افتادن امکان ایجاد کانال در تلگرام، شاهد افت وب سایتهای تخصصی و مقالات به روز و حرفه ای در حوزه های مختلف و بخصوص فناوری اطلاعات هستیم. هر چند وب سایتهایی مانند دیجیاتو و ماهنامه شبکه و ...

ادامه مطلب »

کارگاه تخصصی کلان داده و بانک های اطلاعاتی NoSQL در سنندج

به دعوت پارک علم و فناوری کردستان، کارگاه دوروزه ای را در این مرکز در تاریخ پنجم و ششم دیماه برگزار خواهم کرد. در روز اول به مباحث زیر خواهم پرداخت : که تمامی مباحث فوق به صورت عملی با نصب هدوپ بر روی یک ماشین مجازی اوبونتو، کار خواهد ...

ادامه مطلب »

الگوهای معماری داده NoSQL

  بخش اول الگوهای جدید معماری بانک های اطلاعاتی NoSQL چه چیزی هستند و این نوع بانک های اطلاعاتی قرار است پاسخگوی چه نوع مسائلی باشند ؟ چگونه می توان با توجه به نوع نیاز و ماهیت مساله از یک الگوی مناسب NoSQL استفاده کرد ؟ سعی خواهیم کرد در ...

ادامه مطلب »