Cloud Insight

Cloud Scale Analytics 101: Chapter 3 Sources of data

By January 7, 2021 January 27th, 2021 No Comments

“분석”은 기술 분야는 물론 주요 비즈니스 분야에서도 반복적으로 들리고, 수많은 비즈니스 대화 상황에서 자주 언급됩니다.
하지만 분석의 의미는 무엇이고, 귀사와 같은 기업에는 어떻게 도움이 될까요?

분석의 의미와 용도에 대한 공통의 이해를 다지는 것은 오늘날 비즈니스 성공에 매우 중요합니다.
분석을 통해 조직은 끊임없는 개선이 요구되는 시대에 선제적 운영 모드로 전환할 수 있습니다.

데이터의 출처

분석 기능을 제대로 수행하려면 서로 다르지만 겹치는 데이터 집합을 통합해야 합니다.
그러나 이 과정을 올바르게 해내려면 마이닝할 데이터 출처에 대해 조금 다르게 생각할 필요가 있습니다.
운영 애플리케이션의 기본이 되는 모든 데이터베이스를 비롯하여 분명히 보이는 출처도 있습니다.

데이터의 출처는 다음과 같습니다.

  • SaaS 애플리케이션
    마케팅
    운영
    재무
    소셜 미디어
    영업

관계형 데이터베이스 플랫폼에서 실행되는 OLTP(온라인 트랜잭션 처리) 데이터베이스든, NoSQL 데이터베이스에서 실행되는 데이터베이스든 간에, 효과적인 분석 기능 플랫폼을 구현하려면 데이터를 확보해야 합니다.

또한 다른 출처도 확인해 봐야 합니다. 예를 들어, 디스크의 파일에는 중요한 데이터가 많이 있습니다. 대부분은 CSV(쉼표로 구분된 값)라는 간단한 형식으로 되어 있습니다. 이 형식에서는 파일의 각 행을 데이터 행으로 처리하고, 쉼표는 행 내 데이터의 필드 구분자 역할을 합니다.

어디에나 존재하는 파일 기반 데이터

여러분의 컴퓨터에도 있습니다. 클라우드 스토리지에도 있습니다. 다음 장에서 다룰 “Data Lake” 기술에도 있습니다. 어디에 있든 간에, 분석 기능을 구현할 때는 이 파일 기반 데이터를 포함시키는 것이 매우 중요합니다.

이렇게 얻은 실시간 인사이트는 최신 데이터 웨어하우징 및 머신 러닝과 함께 클라우드 규모 분석의 핵심 요소입니다.

스트리밍 데이터.

“움직이는 데이터”라고도 하는 스트리밍 데이터를 잊지 마십시오. 스트리밍 데이터란 웹 사이트, 소셜 미디어, 심지어 사물 인터넷(IoT)에 연결된 디바이스에서 끊임없이 생산되는 데이터입니다. 이 데이터는 캡처하기가 약간 더 까다로울 수 있지만, 진정한 최신 실시간 데이터 분석이 가능하므로 보상은 큽니다. 이렇게 얻은 실시간 인사이트는 최신 데이터 웨어하우징 및 머신 러닝과 함께 클라우드 규모 분석의 핵심 요소입니다.

온-프레미스 및 클라우드.

온-프레미스 및 클라우드에서 실행되는 모든 애플리케이션이 있습니다. ERP(엔터프라이즈 리소스 계획), CRM(고객 관계 관리), 마케팅, 고객 서비스, 웹 분석 기능 등입니다. 이들 각각에는 애플리케이션에서 데이터를 얻을 수 있도록 하는 API(애플리케이션 프로그래밍 인터페이스)가 있습니다. 과다한 API가 위협적인 것처럼 보이면 그러한 API를 데이터베이스의 테이블처럼 보이게 할 수 있는 커넥터가 있다는 점을 고려하십시오.

실제 의미

스트리밍 데이터, 온-프레미스 및 클라우드 등 모든 출처의 데이터를 일관된 방식으로 사용할 수 있도록 하면 의미 있는 클라우드 규모의 분석 기능을 구현하는 데 도움이 됩니다.

Leave a Reply

Secured By miniOrange