علم نوپای داده در ایران از کمبود افراد باتجربه دست به قلمی که چراغی فرا راه علاقهمندان این حوزه روشن کنند و نوپویان این مسیر را به درستی راهنمایی کنند،رنج برده است. جناب سعید میرشکاری عزیر د ر سایت ویرگول به بیان تجربه خود در مسیر تبدیل شدن به یک دانشمند علم داده پرداخته است…
ادامه مطلب »نوشته های تازه
پیشبینی قیمت خودرو بر اساس دیتاست منتشر شده سایت دیوار
مجموعه کافهبازار اخیراً دیتاستی حاوی حدود یک میلیون رکورد از خرید و فروشهای سایت دیوار را به صورت عمومی منشتر کردهاند و سعید میرشکاری تحلیل سادهای بر روی آنها انجام داده است که این مقاله، بازنشر مطلب ایشان است.
ادامه مطلب »دست به کد: جمع آوری و تحلیل دادههای توئیتر فارسی در چند دقیقه
اگر قصد جمعآوری و تحلیل دادههای فارسی در شبکههای اجتماعی و بخصوص توئیتر را دارید، به کمک این آموزش گام به گام و به مدد امکانات آنلاین مایکروسافت، در چند دقیقه و بدون نیاز به نصب نرم افزار یا حتی آشنایی با برنامهنویسی، شروع به جمع آوری و تحلیل دادههای توئیتر نمایید.
ادامه مطلب »کلان داده چگونه باعث ایجاد بحرانی بزرگ در علم شده است؟
در این نوشتار با ذکر مثالهایی میبینیم چقدر احتمال دارد دانشمندان از روی بختواقبال سیگنالهای جالب، اما غیرواقعی را از مجموعهی دادهها استخراج کنند. آنها احتمالا براساس همین سیگنالها فرضیهسازی و از همان مجموعهی دادهی قبلی برای نتیجهگیری استفاده میکنند.
ادامه مطلب »نگاهی به صنعت مانیتورینگ با معرفی Prometheus
با گسترش بانکهای اطلاعاتی و سرویسهای مختلف نرم افزاری در شرکتها و سازمانهای امروزی، نیاز به ابزاری برای پایش مداوم و بررسی وضعیت سرویسهای مختلف بر اساس پارامترهای قابل تعریف، از جمله نیازهای رو به رشد حوزه زیرساخت است. در این مصاحبه با پرومتئوس به عنوان یکی از طلایهداران صنعت مانیتورینگ دنیا آشنا میشویم.
ادامه مطلب »انتخاب پستگرس به عنوان دیتابیس برگزیده سال ۲۰۱۸
وب سایت DB-Engines به عادت مألوف، با بررسی گرایشات جهانی و سایر پارامترهایی که خود تعریف کرده است، دیتابیس منتخب سال ۲۰۱۸ را معرفی کرده است که این عنوان به برای دومین سال متوالی به پستگرس رسیده است. این دیتابیس که امسال وارد سی امین سال حیات خود میشود، نه ...
ادامه مطلب »آپاچی فلینک : پرچمدار پردازش جریانهای داده
شرکت عظیم علیبابا که به آمازون چین معروف است، هفته گذشته رسما اعلام کرد که شرکت data Artisans که توسط توسعهگران اولیه آپاچی فلینک در سال 2014 ایجاد شده است را به قیمت 90 میلیون یورو خریداری کرده است تا باعث رونق صنعت پردازش دادههای جریانی در دنیا شود. خبری که نوید بخش رشد سریع آپاچی فلینک در سالیان آتی خواهد بود. فلینک به عنوان یکی از پیشروترین موتورهای پردازش جریانهای داده آپاچی، امروزه توسط شرکتهای بزرگی چون نتفلیکس و اوبر در حال استفاده است. در این مقاله در ادامه مباحث آشنایی با سامانههای جریانپرداز دنیا، به مرور قابلیتهای این پروژه متنباز خواهیم پرداخت.
ادامه مطلب »معماری پیشنهادی برای پردازش لحظهای دادههای بورس
پردازش داده های بورس همواره یکی از حوزه های جذاب کاربردهای هوش مصنوعی و یادگیری ماشین در سالیان اخیر بوده است. با توجه به حجم بسیار بالای داده های تبادل شده در این صنعت و نیاز به اخذ تصمیمات لحظه ای، نیازمند یک معماری کامل و جامع و با نگاه به نیازمندیهای آینده هستیم . در این نوشتار، به بررسی ابزارهای موجود در حوزه کلان داده برای ایجاد یک خط پردازش لحظهای داده های بورس میپردازیم.
ادامه مطلب »SqlDBM ابزاری آنلاین برای مدلسازی بانک اطلاعاتی
چندی پیش مشاهده کردم یکی از بچههای فعال واحد آیتی، مدلسازی و مستندسازی بانکهای اطلاعاتی دانشگاه را با ابزاری آنلاین به آدرس sqldbm.com انجام میدهد که با پرس و جو از ایشان، متوجه شدم که به عنوان یک برنامه نویس حرفهای، از کار با این ابزار مدلسازی آنلاین کاملاً راضی ...
ادامه مطلب »چرا گاردین از مانگودیبی به پستگرس مهاجرت کرد ؟
روزنامه قدیمی گاردین که سالها از دیتابیس مانگو برای مدیریت مقالات و اسناد خود استفاده میکرد در سال 2017 تصمیم به مهاجرت به پستگرس گرفت. این مقاله، خلاصه ای از مقاله اصلی منتشر شده در ماه اخیر توسط گاردین است.
ادامه مطلب »کارگاه فرآیندکاوی و اهمیت آن در سازمانها
با حمایت معاونت علمی ریاست جمهوری و کافه بازار، سخنرانی آقای مهندس هادی ستوده با موضوع "فرآیند کاوی و اهمیت آن در سازمانها، شرکتها و دستگاههای اجرایی" در روز شنبه 8 دی ماه کافه بازار برگزار میشود.
ادامه مطلب »یوتیوب، وایتِس و حل مشکل مقیاسپذیری MySQL
خیلی از تیمها و استارتاپها کار خود را با MySQL شروع میکنند و به مرور زمان و با افزایش تعداد درخواستها و دادهها با MySQL دچار چالش میشوندو مهاجرت از این دیتابیس و امتحان گزینههای دیگر، هزینه زیادی برای این شرکتها دارد. بنابراین بهتر است که راهحلی پایدار و مناسب برای مقیاسپذیری MySQL پیدا کنیم. در این پست راهحلی که توسط یوتیوب توسعه داده و اپن سورس شد و امروزه به نام پروژه Vitess شناخته میشود را با هم بررسی میکنیم.
ادامه مطلب »