머신 데이터(machine data) - 디지털 데이터, 로그 파일, 시계열 데이터, 빅데이터

머신 데이터(machine data)는 어느 조직에서나 충분히 활용되지 않고 가장 과소평가되는 자산 중 하나입니다. 하지만 문제가 발생한 위치, 고객 경험을 최적화하는 방법, 부정행위의 특징 등 IT와 비즈니스에서 얻을 수 있는 가장 중요한 통찰력은 바로 머신 데이터(machine data)에 숨겨져 있습니다. 이 모든 통찰력은 조직의 정상 작동에 의해 생성되는 머신 데이터(machine data)에서 찾을 수 있습니다.

머신 데이터(machine data)는 고객, 사용자, 트랜잭션, 애플리케이션, 서버, 네트워크, 모바일 장치의 모든 작업과 행동에 대한 정확한 기록을 포함하고 있기 때문에 그 가치가 매우 큽니다. 머신 데이터(machine data)에는 설정, API의 데이터, 메시지 대기열, 변경 이벤트, 진단 명령어 출력, CDR(call detail record), 산업 시스템의 센서 데이터 등이 포함됩니다.

머신 데이터(machine data) 활용 시 문제점은 머신 데이터(machine data)가 예측하기 어려운 다양한 형식으로 제공되며, 기존의 모니터링 및 분석 도구로는 머신 데이터(machine data)의 다양성, 속도, 볼륨 또는 변동성을 파악할 수 없다는 것입니다. Splunk는 이에 관해 도움을 드릴 수 있습니다.

Splunk 플랫폼은 시스템, 기술 및 인프라에 의해 생성된 정보인 머신 데이터(machine data)를 사용하여 비즈니스의 빅데이터, IT 운영, 보안 및 분석 이용 사례를 지원합니다. 머신 데이터(machine data)에서 얻은 통찰력은 조직 전체의 다양한 이용 사례를 지원하며, 다른 소스의 데이터를 사용하여 통찰력을 강화할 수도 있습니다. 엔터프라이즈 머신 데이터(machine data) 구조는 이러한 통찰력을 얻을 수 있도록 조직 전체의 머신 데이터(machine data)를 공유하고 데이터 액세스 권한을 제공합니다. 이를 운영 인텔리전스라고 합니다.

시작하기
  • 비디오
    머신 데이터(machine data)란?
  • 데이터시트 Splunk Enterprise
  • 백서(등록 필요) 머신 데이터(machine data)를 전략적 자산으로 만들기
  • 리소스 Splunk 검색 처리 언어(SPL)의 기능
  • 정보 그래픽 엔터프라이즈 머신 데이터(machine data) 구조
Splunk Enterprise 무료 다운로드

머신 데이터(machine data) 소스

머신 데이터(machine data) 소스

모든 환경에는 머신 데이터(machine data)마다 다른 정보가 있습니다. 몇 가지 예는 다음과 같습니다.

데이터 형식 데이터 위치 데이터 정보
애플리케이션 로그 로컬 로그 파일, log4j, log4net, Weblogic, WebSphere, JBoss, .NET, PHP 사용자 작업, 부정행위 탐지, 애플리케이션 성능
비즈니스 프로세스 로그 비즈니스 프로세스 관리 로그 채널, 구매, 계정 변경, 문제 보고서에 걸친 고객 활동
CDR 통신 및 네트워크 스위치를 통해 기록된 CDR(call detail record), 요금 데이터 레코드, 이벤트 데이터 레코드 청구, 수익 보장, 고객 상담, 파트너 계약, 마케팅 인텔리전스
클릭스트림 데이터 웹 서버, 라우터, 프록시 서버, 광고 서버 가용성 분석, 디지털 마케팅 및 일반 조사
설정 파일 시스템 설정 파일 인프라 설정 방식, 디버깅 오류, 백도어 공격, 시한 폭탄
데이터베이스 감사(audit) 로그 데이터베이스 로그 파일, 감사(audit) 테이블 장기간 데이터베이스가 수정된 방식 및 변경한 사람
파일 시스템 감사(audit) 로그 공유 파일시스템에 저장된 중요한 데이터 중요한 데이터에 대한 읽기 액세스 권한 모니터링 및 감사(audit)
관리 및 로깅 API OPSEC Log Export API(OPSEC LEA) 및 기타 VMware 및 Citrix의 공급업체별 API를 통한 Checkpoint 방화벽 로그 관리 데이터 및 로그 이벤트
메시지 대기열 JMS, RabbitMQ 및 AquaLogic 복잡한 애플리케이션 및 애플리케이션에 대한 로깅 아키텍처의 백본에서 발생하는 디버깅 문제
운영 체제 메트릭, 상태 및 진단 명령어 Unix와 Linux의 ps, iostat와 같은 명령줄 유틸리티 및 Windows의 성능 모니터를 사용한 CPU 및 메모리 사용 및 상태 정보 문제 해결, 동향 분석을 통한 잠재적인 문제 발견 및 보안 사고 조사
패킷/유동 데이터 pcap 또는 유동 데이터와 기타 유용한 패킷 수준 및 세션 수준 정보를 생성하는 tcpdump 및 tcpflow 네트워크가 느려지거나 원격 공격의 대상이 될 수 있음을 나타내는 성능 저하, 시간 초과, 병목 또는 의심스러운 작업
SCADA 데이터 SCADA(Supervisory Control and Data Acquisition) SCADA 인프라에서 동향, 패턴 및 특이점을 파악하고 고객 가치를 증대하는 데 사용됨
센서 데이터 온도, 소리, 압력, 전원, 수위 등과 같은 환경 조건 모니터링을 기준으로 데이터를 생성하는 센서 장치 수위 모니터링, 기계 상태 모니터링 및 스마트 홈 모니터링
Syslog 라우터, 스위치 및 네트워크 장치의 Syslog 문제 해결, 분석 및 보안 감사(audit)
웹 액세스 로그 웹 액세스 로그는 웹 서버에서 처리되는 모든 요청을 보고함 마케팅을 위한 웹 분석 보고서
웹 프록시 로그 웹 프록시는 사용자가 웹 프록시를 통해 수행하는 모든 웹 요청을 기록함 서비스 약관 및 데이터 유출 사고 모니터링 및 조사
Windows 이벤트 Windows 애플리케이션, 보안 및 시스템 이벤트 로그 비즈니스 크리티컬 애플리케이션, 보안 정보 및 사용 패턴을 통해 문제 탐지
와이어 데이터(wire data) DNS 룩업 및 레코드, 헤더, 콘텐츠 및 플로우 레코드 등을 포함한 프로토콜 수준 정보 애플리케이션 성능 및 가용성, 최종 사용자 경험, 사고 조사, 네트워크, 위협 탐지, 모니터링 및 컴플라이언스의 능동적 모니터링