Наукова електронна бібліотека
періодичних видань НАН України

Некоторые программные среды аналитики больших данных и машинного обучения

Репозиторій DSpace/Manakin

Показати простий запис статті

dc.contributor.author Урсатьев, А.А.
dc.date.accessioned 2017-02-07T20:45:08Z
dc.date.available 2017-02-07T20:45:08Z
dc.date.issued 2016
dc.identifier.citation Некоторые программные среды аналитики больших данных и машинного обучения / А.А. Урсатьев // Управляющие системы и машины. — 2016. — № 5. — С. 62-75. — Бібліогр.: 82 назв. — рос. uk_UA
dc.identifier.issn 0130-5395
dc.identifier.uri http://dspace.nbuv.gov.ua/handle/123456789/113401
dc.description.abstract Рассмотрено машинное обучение и распределенная обработка данных на Apache Mahout. Сопоставлены две его реализации – на основе использования парадигмы MapReduce и программной конструкции (framework) Spark с математической средой Mahout Samsara, которая создает семантически дружественные условия для линейной алгебры, построена по образу базового пакета в R, содержит алгебраический DSL Scala и оптимизатор выражений. Библиотека ML Mllib поддерживает универсальную масштабируемую линейную алгебру и включает в себя многие современные алгоритмы. uk_UA
dc.description.abstract Розглянуто машинне навчання і розподілена обробка даних з Apache Mahout. Зіставлені дві його реалізації – з використанням парадигми MapReduce та програмної конструкції Spark з математичним середовищем Mahout Samsara, яке створює семантично дружні умови для лінійної алгебри, побудоване за образом базового пакета в R, містить алгебраїчний DSL Scala та оптимізатор виразів. Бібліотека ML Mllib підтримує універсальну масштабовану лінійну алгебру і включає в себе чимало сучасних алгоритмів. uk_UA
dc.description.abstract The machine Learning (Machine Learning, ML) and distributed processing of the large data collections on Apache Mahout with the automatic search ability for relevant laws are considered. Its realization through the use of MapReduce paradigm and framework Spark is compared. The representation of data and mechanisms to restore their failures, the method of calculation and the ability to cache data in memory are considered. The latter is a key tool for fast interactive use. Spark is implemented on Scala. It combines the best features of functional and object-oriented programming languages, and uses it as an application of the environment development. It provides the application programming interface for the Java language, Scala, Python and R, invites more than 80 high-level operators that makes it easily accessible for the construction of a parallel applications. Interactive mathematical environment Mahout Samsara ML includes an extended version of Scala. Mahout Samsara or the Scala & Spark Bindings are necessary for creation the semantically friendly conditions for еру linear algebra, and is built in the image of the base package in R. The linear algebra works with scalars, vectors, matrices and distribution lines of the matrices (distributed row matrix, DRMs). DRM is a new abstraction, introduced in Apache Mahout for the representation and processing matrices convenience. One of the main elements of Mahout Samsara is algebraic DSL Scala and expressions optimizer. ML Mllib, supports the scalable universal linear algebra and includes many modern algorithms. uk_UA
dc.description.sponsorship Автор выражает благодарность за помощь в подготовке фрагментов материала настоящей работы В. Духновскому uk_UA
dc.language.iso ru uk_UA
dc.publisher Міжнародний науково-навчальний центр інформаційних технологій і систем НАН та МОН України uk_UA
dc.relation.ispartof Управляющие системы и машины
dc.subject Методы и средства обработки данных и знаний uk_UA
dc.title Некоторые программные среды аналитики больших данных и машинного обучения uk_UA
dc.title.alternative Деякі програмні середовища аналітики великих даних і машинного навчання uk_UA
dc.title.alternative Some Frameworks for Big Data Analytics and Machine Learning uk_UA
dc.type Article uk_UA
dc.status published earlier uk_UA
dc.identifier.udc 004.7:004.75:004.9:004.738.5


Файли у цій статті

Ця стаття з'являється у наступних колекціях

Показати простий запис статті

Пошук


Розширений пошук

Перегляд

Мій обліковий запис