خانه / اخبار

اخبار

هوش مصنوعی، کلان داده و انتخابات آمریکا

trump

با اوج گیری رقابت های انتخاباتی بین دونالد ترامپ و هیلاری کلینتون در هفته های گذشته، شاهد پیش بینی ها و نظر سنجی های مختلفی درباره برنده این انتخابات بودیم که اکثر آنها، کلینتون را رئیس جمهور آینده آمریکا میدانست. با این وجود و علیرغم انتظار رسانه ها، ترامپ توانست ...

ادامه مطلب »

نگاهی مقایسه ای به پروژه های پردازش جریان آپاچی

Screen_Shot_2015-12-28_at_16.43.04

در حوزه پردازش داده، دو نوع اصلی پردازش داریم : پردازش بلادرنگ (Real Time) یا همان پردازش جریان (Stream Processing) و پردازش انبوه (Batch Processing) که فناوریهای اصلی حوزه کلان داده ، مانند روش توزیع و تجمیع (MapReduce)، و جدیدا اسپارک برای پردازش انبوه داده ها طراحی شده اند و ...

ادامه مطلب »

مقدمه ای بر پیکان (Apache Arrow) : تحلیل درون حافظه داده های ستونی

MockingJay

پروژه متن باز پیکان ، علیرغم نوپا بودنش در اکو سیستم آپاچی، در حال تبدیل شدن به یک استاندارد در حوزه پردازش داده و ایجاد یک بستر مناسب برای تعامل بین فناوریهای مختلف کلان داده است. توسعه گران ارشد ۱۳ پروژه متن باز اصلی دنیای کلان داده، یک تیم مشترک ...

ادامه مطلب »

معرفی سایت experfy – منبعی برای انجام و درخواست پروژه های تحلیل داده

Expppp

فرض کنید که شما به عنوان یک شرکت یا سازمان ، نیاز به مشاور یا متخصصینی در حوزه تحلیل و مهندسی داده دارید و  مساله و مشکلی دارید که باید با استفاده از داده های موجود شما حل شده و راه حلی مناسب برای آن پیدا شود. از طرفی، به ...

ادامه مطلب »

تحلیل اکتشافی داده ها در پایتون – بررسی داده های کشتی تایتانیک

data-science-with-r-for-java-developers-30-638

مقدمه اولین گام در یادگیری ماشین و مهندسی داده ، بررسی مجموعه داده های موجود و آشنایی با خواص مختلف آماری آنهاست که به نام تحلیل اکتشافی داده (این اینفوگرافیک را از دست ندهید)از آن یاد می کنیم. در بسیاری از موارد، این تحلیل اولیه، عملیات پیش پردازش داده را ...

ادامه مطلب »

دریاچه داده : معماری جدید برای زیرساخت تحلیل و پردازش اطلاعات

Lake

در دنیای کلان داده، مدتیست که عبارت دریاچه داده به یک اصطلاح فراگیر در حوزه معماریهای پیشنهادی برای پردازش داده ها تبدیل شده است . دریاچه داده از دید مفهومی، یک مکان مشترک برای ذخیره انواع داده های یک سازمان به صورت خام و پردازش نشده است . برخلاف انباره ...

ادامه مطلب »

بررسی محبوبیت بانکهای اطلاعاتی – ماه اکتبر ۲۰۱۵

dbengines

سایت DB-Engines هر ماه فهرست محبوبیت بانکهای اطلاعاتی خود را به روز کرده و در اختیار عموم قرار می دهد. قبلاً در همین سایت راجع به اینکه سه تا از بانکهای اطلاعاتی NoSQL یعنی مانگو ، ردیس و کاساندرا جزء ده تای اول این لیست هستند، صحبت شده بود اما ...

ادامه مطلب »

معرفی AGATE – کتابخانه ای نوین برای کار با داده ها در پایتون

images-mod1-big-picture-eda

در اولین پاراگراف از مستندات کتابخانه AGATE این دو جمله را می بینیم : توصیفی حاکی از این که این کتابخانه برای استفاده آسان کاربران ایجاد شده است و جایگزینی برای دو کتابخانه معروف Pandas و  Numpy خواهد بود که برای محاسبات عددی و کار بر روی داده ها به ...

ادامه مطلب »

مقدمه ای بر زبان Go – زبانی ساده برای نیازهای امروز

google-go-language

چند روز پیش یکی از دوستان سوالی از بنده توی اسکایپ پرسید  که برای یک برنامه تحت وب که در ثانیه درخواستهای بسیار زیادی را باید به سرعت جواب بدهد، چه زبان برنامه سازی را باید انتخاب کنم ؟ ابتدا از خود سوال کمی تعجب کردم چون بیشتر از خود زبان، ...

ادامه مطلب »

فهرستهای حرفه ای گیت هاب در حوزه های مختلف آی تی

GitHubAwsesome

سایت گیت هاب، جای پای خود را در اکثر پروژه های متن باز دنیا باز کرده است و به عنوان یک مخزن آزاد، پذیرای کدهای مختلف برنامه های متن باز و تجاری از سراسر دنیاست . هدف اصلی این سایت ، مشابه سایت بیت باکت یا گیت لب ، مدیریت ...

ادامه مطلب »