خانه / علم داده

علم داده

گرادیان بوستینگ چیست ؟

یکی از انواع الگوریتم‌های دسته‌بندی با دقت بالا الگوریتم‌های مبتنی بر مشارکت گروهی و نیز بهبود مستمر (بوستینگ) است که از بین آنها، روش بهبود گرادیان با استقبال خوبی مواجه شده است. جناب آیدین عابدی نیا زحمت تهیه مطلب مفیدی را در این زمینه کشیده اند که وب سایت مهندسی داده به باز نشر آن اقدام کرده است

ادامه مطلب »

پیش‌بینی دیابت با استفاده از درخت تصمیم «نرم‌افزار رپیدماینر»

یک مثال کاربردی از داده‌کاوی در صنعت پزشکی (پیش‌بینی دیابت) که توسط جناب امیر عبداللهی در سایت Dataio.ir منتشر شده است و وب سایت مهندسی داده به باز نشر بخشی از آن پرداخته است.

ادامه مطلب »

راهنمای انتخاب الگوریتم مناسب در یادگیری ماشین

با توجه به گستره الگوریتم های مورد استفاده در یادگیری ماشین و نیاز به انتخاب مناسب مدل و الگوریتم مورد نیاز، تصمیم گرفتیم نسخه ای از این راهنما را که در سایت شرکت معتبر تحلیل آماری SAS منتشر شده است را برای علاقه‌مندان این حوزه به زبان فارسی تبدیل کنیم با این امید که یک ابزار دم دستی برای علاقه‌مندان و فعالین این حوزه باشد.

ادامه مطلب »

انویدیا، RAPIDS وتحولی نوین در پردازش داده

کار با واحدهای پردازش گرافیک برای کارهای محاسباتی سابقه‌ای دیرینه دارد. افزایش حجم داده‌ها و نیاز به سرعت بیشتر در تحلیل و پردازش آنها، بازیکنان اصلی پردازش داده دنیا را گرد هم آورده است تا به کمک تجربه شرکت انویدیا، خطوط پردازش داده خود را به پردازه‌های گرافیکی منتقل کنند. RAPIDS خروجی این همکاری است و نویدبخش آینده‌ای بهتر برای علم داده

ادامه مطلب »

اشتباهات رایج شرکت‌ها در جذب تحلیل‌گران داده

در حال حاضر در بیشتر استارت‌آپ‌ها و حتی برخی شرکت‌ها بزرگ کشور مشکلات متعددی در جذب کارشناسان و متخصص‌های حوزه‌های علم‌داده، کلان داده و… وجود دارد. این مشکلات را می‌توان در موارد زیر دسته‌بندی نمود.

ادامه مطلب »