خانه / علم داده (صفحه 2)

علم داده

چطوری کپچای سیستم گلستان رو با کمک یادگیری ماشین بشکنیم؟

همه‌ی ما از کپچا (CAPTCHA) فراری ایم – همون تصاویر مزاحمی رو میگم که نوشته های درهم ریخته است و برای اینکه به فرم یا صفحه ای از سایت دسترسی داشته باشیم باید اونو تایپ کنیم. کپچاها برای تشخیص انسان از بات ها (همون برنامه های اتوماتیک) و معمولا برای ...

ادامه مطلب »

گرادیان بوستینگ چیست ؟

یکی از انواع الگوریتم‌های دسته‌بندی با دقت بالا الگوریتم‌های مبتنی بر مشارکت گروهی و نیز بهبود مستمر (بوستینگ) است که از بین آنها، روش بهبود گرادیان با استقبال خوبی مواجه شده است. جناب آیدین عابدی نیا زحمت تهیه مطلب مفیدی را در این زمینه کشیده اند که وب سایت مهندسی داده به باز نشر آن اقدام کرده است

ادامه مطلب »

پیش‌بینی دیابت با استفاده از درخت تصمیم «نرم‌افزار رپیدماینر»

یک مثال کاربردی از داده‌کاوی در صنعت پزشکی (پیش‌بینی دیابت) که توسط جناب امیر عبداللهی در سایت Dataio.ir منتشر شده است و وب سایت مهندسی داده به باز نشر بخشی از آن پرداخته است.

ادامه مطلب »

راهنمای انتخاب الگوریتم مناسب در یادگیری ماشین

با توجه به گستره الگوریتم های مورد استفاده در یادگیری ماشین و نیاز به انتخاب مناسب مدل و الگوریتم مورد نیاز، تصمیم گرفتیم نسخه ای از این راهنما را که در سایت شرکت معتبر تحلیل آماری SAS منتشر شده است را برای علاقه‌مندان این حوزه به زبان فارسی تبدیل کنیم با این امید که یک ابزار دم دستی برای علاقه‌مندان و فعالین این حوزه باشد.

ادامه مطلب »

انویدیا، RAPIDS وتحولی نوین در پردازش داده

کار با واحدهای پردازش گرافیک برای کارهای محاسباتی سابقه‌ای دیرینه دارد. افزایش حجم داده‌ها و نیاز به سرعت بیشتر در تحلیل و پردازش آنها، بازیکنان اصلی پردازش داده دنیا را گرد هم آورده است تا به کمک تجربه شرکت انویدیا، خطوط پردازش داده خود را به پردازه‌های گرافیکی منتقل کنند. RAPIDS خروجی این همکاری است و نویدبخش آینده‌ای بهتر برای علم داده

ادامه مطلب »