Що таке Data Science і як почати працювати з великими даними

Mar 02 12:00 2020 Друк цієї статті

Що ж таке машинне навчання? Якщо коротко, це інструмент, який дозволяє програмувати системи на автоматичне навчання та вдосконалення з набуттям нового досвіду. Важливим аспектом машинного навчання є такий феномен, як Big Data, або великі дані. Причому цей обсяг даних зростає в геометричній прогресії. Наприклад, біологія сьогодні має 1 эксабайтом даних про геномах, що дорівнює 10 байтам в 18-й ступеня.Машинне навчання знаходить все більше сфер примененияСодержание

  • 1 Де застосовується машинне навчання
  • 2 Хто такі фахівці Data Science
  • 3 почати працювати в Data Science
  • 4 Для чого потрібен Deep Learning

Де застосовується машинне навчання

Де машинне навчання застосовується в повсякденному житті? Елементарний приклад - коли ви заходите в соціальну мережу, і там відображається блок з записами людей, яких ви можете знати. Як сайт дізнається, що ви дійсно знайомі з тим або іншою людиною, навіть якщо ніколи не заходили на його сторінку і не писали йому? Система навчається на основі відкритого великого набору даних.

Або ось - у 2012 році Google провела експеримент, в якому використовувалося 1000 серверів з приблизно 16 тисячами ядер. В ході випробувань нейромережа аналізувала 10 мільйонів скріншотів різних випадкових відео з YouTube, з яких змогла з високим ступенем точності визначити зображення котів. І зараз машинне навчання через споживання великої кількості зображень дозволяє з успіхом реалізовувати проект самокерованого автомобіля Google.

Прикладів використання машинного навчання досить багато, причому часто воно може розкрити багато загадки історії. Так, у 1962 році троє ув'язнених змогли покинути «Алькатрас» — в'язницю, з якої, здавалося б, неможливо втекти. Слідчі вирішили, що чоловіки потонули після втечі, проте через майже 60 років нейромережа від компаній Identv і Rothco, проаналізувавши мільйони фото, «впізнала» двох злочинців на знімку 1975 року.Те саме фото, на якому знайшли колишніх ув'язнених

Навчитися працювати з машинним навчанням можна онлайн за кілька місяців - наприклад, пройшовши курс Machine Learning PRO від SkillFactory. І це не просто нудний курс з купою теорії (хоча і без неї ніяк): в першу чергу вас навчать оцінювати та оптимізувати моделі і навіть допоможуть навчити перші нейромережі. А в кінці чекає фінальний хакатон з реальним набором даних зразок відгуків з онлайн-магазину книг Amazon Kindle Store.З чого складається курс з машинного навчання

Хто такі фахівці Data Science

Проте одного набору даних мало, навіть якщо їх багато. Необхідно вміти його обробляти для подальшого застосування - цим займаються фахівці з Data Science. Щоб освоїти роботу з даними, не потрібно бути програмістом від бога або мати вчений ступінь з інформатики. Кращі Data Scientist'и отримують свої вміння, постійно працюючи з моделями і наборами даних, вирішуючи конкретні завдання.

Як почати працювати в Data Science

Навчитися професії Data Science можна з нуля - для цього теж є окремий курс, який, до речі, стартує зовсім скоро - 4 березня. Вас навчать основам програмування на Python і аналізу даних, математики та статистики для Data Science, Data Engineering та інших дисциплін. Викладають курс співробітники NVIDIA, компанії EORA, «Яндекс.Дзен» та інші діячі індустрії з багаторічним досвідом роботи.Курси за Data Science

В рамках курсу допоможуть вам опрацювати навички, з якими в майбутньому ви зможете взятися за завдання навчання сервісу розпізнавання мовлення, виявлення шахрайських транзакцій, прогнозування попиту на товари і навіть генерації музики або віршів. Щоб зрозуміти, наскільки ця сфера затребувана, просто подивіться статистику Data Science на російськомовних і зарубіжних кадрових сайтах.Заробітні плати в сфері Data Science

Для чого потрібен Deep Learning

Якщо ж ви вже знайомі з мовою Python і машинним навчанням і хочете отримати практичні навички з програмування глибоких нейронних мереж, зверніть увагу на Deep Learning - спеціальний курс по нейронних мереж, який проводиться за підтримки NVIDIA Corporation.

Викладачі курсу розкажуть повний шлях до глибинного навчання - від оренди спеціального сервера GPU для Deep Learning, аж до створення повноцінної робочої моделі для комп'ютерного зору, аналізу природної мови та рекомендаційних систем. Навчать роботи з фреймворками TensorFlow, Keras та іншими.Це тільки частина програми курсу за глибинного навчання

Для кожного є можливість змінити напрям і навчитися новому, будь то машинне навчання або Deep Learning, тим більше робота з даними зараз особливо затребувана і залишиться такою ще довгі роки. А за промокоду Hi-news у вас є можливість забронювати місце в групі на курс зі знижкою 25% на навчання (промокод діє до 27.03.2020).