FSpaceX - это платформа для обработки и анализа данных, основанная на распределенной архитектуре Hadoop.
Краткое описание платформы
FSpaceX - это платформа обработки и анализа данных, разработанная на основе распределенной архитектуры Hadoop. Платформа может предоставлять функции, основанные на сборе и хранении многоисточниковых изомерных данных, очистке и фильтрации данных, строительстве хранилища данных, применении многотипных алгоритмов, комплексном анализе и визуализации, для предприятий, чтобы решить различные проблемы применения данных, возникающие во всех аспектах жизненного цикла продукции от клиента до производства, для повышения экономической эффективности и конкурентоспособности предприятий.
Технология управления силами имеет профессиональную команду приложений больших данных, чтобы предоставить пользователям комплексный анализ бизнес - потребностей, расчесывать бизнес - приложения, сбор данных, хранение данных, расчеты обработки данных, анализ и раскопки, а также визуальное отображение решений планирования, уточнить цели строительства, установить принципы строительства, разработать план строительства, а также провести разработку платформы, тестирование и развертывание. Используя данные и в сочетании с производственными болевыми точками, чтобы постоянно учиться эволюции, улучшать модели принятия решений и оптимизировать рекомендации по принятию решений.

Общая архитектура промышленных платформ больших данных состоит из трех уровней: фабрик данных, алгоритмических движков и визуализации данных.
Фабрика данных в основном реализует сбор, аудит и хранение изомерных данных, сбор данных может обеспечить интеграцию различных изомерных баз данных, таких как промышленные коммуникационные шлюзы, базы данных в реальном времени и реляционные бизнес - базы данных; Проверка данных - это в основном проверка полученных данных, проверка наличия, пустых значений, типов данных и точности; Хранение данных использует методы хранения и анализа данных Hbase, Greenplum, Redis и других комбинированных приложений баз данных для построения распределенной архитектуры хранения данных, которая динамически увеличивает узлы хранения данных с масштабируемостью, несколькими копиями, высокой пропускной способностью и другими характеристиками.
Алгоритмический движок обеспечивает распределенную вычислительную структуру Spark, которая обеспечивает эффективное использование ресурсов на основе кластера Hadoop, а также возможности вычислений данных в реальном времени и анализа больших объемов данных. Поддержка библиотеки машинного обучения MLib, поддержка алгоритмов обучения уведомлениям и классов инструментов, включая классификацию, кластеризацию, совместную фильтрацию, уменьшение размеров.
Визуализация данных предоставляет наборы данных, компоненты динамического статического набора значений, скрининг данных, преобразование формата данных и другие функции моделирования, поддерживает операции перетаскивания, богатые диаграммы, графические соединения, сверление в верхнем томе, персонализированную типографию, временную почту, ГИС и мультимедийную интеграцию и другие функции.

-
Доступ к изомерным данным, включая временные ряды, изображения, файлы и другие данные.
-
Очистка данных, обеспечивающая разнообразные возможности очистки и обработки данных.
-
Архивирование данных, создание корпоративных хранилищ данных и программ хранения на основе больших данных.
-
Алгоритмические модели искусственного интеллекта, которые обеспечивают интеллектуальные алгоритмы, такие как оптимизация планирования производства (машинное обучение, генетика и т. Д.).
-
Богатый графический компонент, гибкий для многомерного анализа с помощью инструментов визуализации.
-
Программа развертывания приватизации обеспечивает безопасность и надежность основных ресурсов данных внутри предприятия.