نوشته های تازه

آشنایی با معماری‌های داده در طراحی سامانه‌های جریان‌پرداز

در این مقاله به بررسی دو معماری مطرح در حوزه کلان‌داده برای طراحی سیستم‌های اطلاعاتی یعنی معماری لامبدا و کاپا می‌پردازیم و با جنبه‌های مختلف آنها آشنا خواهیم شد.

ادامه مطلب »

نگاهی به مفاهیم و ابزار جریان‌پردازی

پردازش جریان

بعد از حدود یک دهه از ظهور و رواج ابزار و کتابخانه­‌های کلان­‌داده، این سامانه­‌ها از لحاظ الگوریتم­‌ها و مدل­‌های پردازشی مقیاس­‌پذیر به یک ثبات نسبی رسیده­‌اند اما مبحث پردازش جریان، به دلیل رواج روزافزون اینترنت اشیاء و دستگاه­‌های هوشمند و لزوم پردازش سریع و لحظه­‌ای حجم عظیم داده­‌های ورودی، به یک موضوع داغ پژوهشی در چند سال اخیر تبدیل شده است

ادامه مطلب »

اشتباهات رایج شرکت‌ها در جذب تحلیل‌گران داده

در حال حاضر در بیشتر استارت‌آپ‌ها و حتی برخی شرکت‌ها بزرگ کشور مشکلات متعددی در جذب کارشناسان و متخصص‌های حوزه‌های علم‌داده، کلان داده و… وجود دارد. این مشکلات را می‌توان در موارد زیر دسته‌بندی نمود.

ادامه مطلب »

ساخت وب سایت شخصی با پایتون، پلیکان و گیت‌هاب – بخش دوم

در ادامه مقاله آموزشی ساخت وب‌سایت شخصی با پایتون، پلیکان و گیت‌هاب، در این نوشتار به تکمیل بحث و نحوه استفاده از پلیکان، قالب‌ها، پلاگین‌ها و نحوه انتشار آن در اینترنت می‌پردازیم. آماده سازی محیط کار اگر آخرین مرحله بخش اول این مقاله را انجام داده باشید، یعنی آن سایت ...

ادامه مطلب »

اولین جلسه رویداد کوانتک – علم داده در بازارهای مالی

ما در Quantech به چه می اندیشیم: دانش مالی رفتاری، تحلیل بنیادی و تکنیکال و استفاده از مفاهیم ریاضیات و الگوریتم‌ها، برای درک رفتار واقعی بازارهای مالی، نیازمند ابزارهای مدرن برای بررسی مستمر انبوهی از داده‌هاست، که بنظر می‌رسد یک هوش ماشینی بهترین گزینه برای انجام این کار باشد. سری ...

ادامه مطلب »

ساخت وب سایت شخصی با پایتون، پلیکان و گیت‌هاب – بخش اول

به عنوان یک فعال حوزه علم داده نیاز خواهید داشت با دو ابزار کاربردی این دو حوزه یعنی پایتون و گیت آشنا باشید. ضرورت آشنایی با پایتون به عنوان رایجترین زبان علم داده نیازی به توضیح ندارد. گیت هم به عنوان ابزاری برای نگهداری تاریخچه تغییرات بر روی کدهای نوشته ...

ادامه مطلب »

علم داده به زبان ساده – بررسی معیارهای سنجش دسته‌بندی – بخش دوم

در مقاله قبلی به تشریح ماتریس پراکنش (Confusion Matrix) و نیز بررسی دو معیار مهم در سنجش کارآیی مدل‌های دسته‌بندی یعنی معیار صحت (Precision) و بازخوانی (Recall) و نهایتا معیار ترکیبی F1-Score که میانگین هارمونیک این دو معیار است، پرداختیم و بیان شد که هدف اصلی ما در یافتن یک ...

ادامه مطلب »

دومین دوره‌ی مدرسه‌ی تابستانه‌ی یادگیری عمیق

شاخه دانشجویی ACM دانشگاه تهران ، برای علاقه‌مندان به مباحث یادگیری عمیق، دومین دوره آموزش کاربردی یادگیری عمیق را در مرداد ماه ۹۷ با سرفصل‌های زیر برگزار می‌کند : مقدمه ای بر شبکه های عصبی بهینه سازی در شبکه های عصبی و یادگیری عمیق شبکه های عصبی کانولوشنال مباحث پیشرفته ...

ادامه مطلب »