디지털서비스 이슈리포트: 클라우드 컴퓨팅 동향 - 2025 플렉세라 보고서 분석 PDF Free Download

1 / 31
0 views31 pages

디지털서비스 이슈리포트: 클라우드 컴퓨팅 동향 - 2025 플렉세라 보고서 분석 PDF Free Download

디지털서비스 이슈리포트: 클라우드 컴퓨팅 동향 - 2025 플렉세라 보고서 분석 PDF free Download. Think more deeply and widely.

03
- 2025
Vol.
2025
- 2 -
물은 디지털서비스 이용지원스템 작권 보유하고 있습니다.
지털서비 이용지원템의 승인 이슈리포트 또는 전부 다른 목적으로 이용 없습니다.
디지털서비스 이슈리포트
01
라우 퓨팅 - 2025 플렉세라 보고
3
│윤대균 학교
02
트렌드-AI를 결합 이터 이크(Data Lake)
9
│Senior Program Manager 김영
03
AI를
18
│한상기 론티
04
라우 스마트팩토리 -
24
│정채상 연구 기술 책임자
- 3 -
01 - 2025
│윤대균 아주대학교
1. 들어가며
플렉세라(Flexera)사에서는 다양한 컴퓨터 소프트웨어 산업 분야의 보고서를 매년 발표한다.
클라우드 컴퓨팅 산업에 관한 보고서가 State of the Cloud Report’이다. 보고서의 조사 대상
방식 일반적인 배경은 이번 해도 예년과 거의 동일하므로 전년도 필자의 리포트를 참고하길 바란다.1)
이번 이슈 리포트에서는 지난 2024년 플렉세라 보고서와 비교하여 흐름의 변화를 간략히 추적하는
중점을 두었다. 특별히 짚고 넘어갈 만한 부분은 필자가 개인적인 의견을 담아 강조하였다. 플렉세라
보고서의 상당 부분을 커버하는 상세 도표는 생략하였으니 이는 리포트 원본을 참고하길 바란다.2)
보고서에서는 매우 다양한 스펙트으로 클라우드 활용 현황 조사 결과를 시하고 있다. 이슈
리포트에서는 주요 동향에 대해서 살펴보기로 하겠다.
2. 주요 동향 분석
2.1. 클라 도입 현황
2.1.1 멀티클라우드 전략 유지
2025년 보고서에 따르면, 대부분 조직은 이전과 마찬가지로 멀티클라우드 전략 채택하 있다.
응답자의 70%가 하이브리드 클라우드 전략3) 사용하고 있으며, 여러 개의 퍼블릭 클라우드까
포함하는 클라우드 용률은 86%이다. 2024년도에는 수치가 각각 73%, 89%이다. 다소
줄어들기는 했으 특별히 의미 있는 변화는 아니고, 히려, 2025년 이터는 이러한 "안정
상태(steady state)" 확인해 주며, 직이 자신의 필요에 맞는 적합한 클라우드 합을 찾은 것으로
보인다.
1) 디지털서비스 슈리포트, “클라우드 - 2024년 플렉세라 리포트 석”, 2024.05
2) https://info.flexera.com/CM-REPORT-State-of-the-Cloud
3) 최소 하나의 블릭 클라우드와 동시에 최소 하나 라이빗 클라우드를 사용하는 것을 말함.
- 4 -
2.1.2 워크로드 회수(Repartration)율
워크로드 수율을 2025년 플렉세 보고서에서 새로 도입한 지표로 기업의 클라우드 활용 전략을
엿볼 미로운 지표다. 그대로 클라우드에 크로드를 다시 온-프레미스 가져온
것을 말한다. 번에 조사에서 응답자는 크로드와 데이터의 21%를 온프레미스 다시 가져
것으로 보고했다. 수치가 다는 퍼블릭 클라우드의 활용이 주춤해지는 것으로 석될
있다. 하지만, 이는 복합적으로 단할 필요가 있는 것으로, 기업의 하이브리드 라우드 전략과
맞물려 있다고 보는 것이 타당하다. 따라 새로운 지표는 2025년 주요 클라우드 트렌드에서도4)
자주 언급되는 기업의 하이브리드/멀티클라우드 전략을 있는 좋은 지표로 활용될 있다.
플렉세라에서는 으로 계속 지표 추적한다고 선언했다.
, 2025 서는 소기업(SMB)의 12 퍼블 클라우드 워크 13%
것으 예상으며, 보고 사상 예상 가율 려졌다. 고로, 2024년 고서
모든 응답 51%의 크로 50% 퍼블 클라우드 나타났다.
2.1.3. 클라우드 제공업체별 활용 현황
AWS와 마이크로소프트 저는 퍼블 라우드 도입에 있어서 계속해 열한 경쟁 벌이고 있다.
실제 클라우드 활용 현황은 워크로드 비율로 있는데, 전체 응답자 "중요한 크로드"를
실행하는 비율은 AWS가 53%로 애저의 50%보다 약간 앞서지만, "일부 워크로드"를 포함하면 애저가
81%로 AWS의 79%보다 앞선다. 플렉세라 보고서에서 따로 언급하지는 않았지만, 필자의 판단으로는
“일부 워크로드”에 마이크로소프트 365 서비스 함되기 때문으로 보인다. GCP는 올해도
3위를 차지하여 조사 대상의 절반(46%)이 GCP에 또는 중요 워크로드를 행하고 있는
것으로 나타났다. 최근 클라우드 서비스를 적극 확대하고 있는 오라클 CI(Cloud Infrastructure)의 경우
전년도 25%에서 27%로 늘었다.
중소기업만 따로 77%가 AWS를 사용하는 반면 59%가 애저를 용하는 것으로 사되어
AWS가 월등히 앞서는 것으로 나타났다. GCP도 42%로 여전히 번째 리를 차지하고 있다. 전년도
기준으로 기업 모두 소폭 하락했다. 하지만 오라클의 경우 2024년 6%만 일부 사용한다고
응답했으나, 2025년에는 “중요한 크로드”를 실행한다고 응답한 1%를 11%로 증가했다.
중소기업에서의 3 활용 비율 감소와 대조적이다.
4) 디지털서비스 슈리포트, “2024 클라우드 트렌드”, 2025.01
- 5 -
2.1.4 MSP(Managed Service Provider) 사용 증가
모든 조직에서 MSP 사용이 2025년에 60% 달했다. 기업의 관점에서는 클라우드 대부분을
MSP에 의뢰하는 것(31%) 분적으로 의뢰하는 것(29%)을 모두 함해서이다. 기업의 MSP 사용은
지난 동안 대적으로 일관되게 유지되었지만, 중소기업(SMB) 부문에서 목할 변화가
있었다. 2024년에 소기업의 36%가 MSP를 용했고, 추가로 13%가 사용할 계획이었다.
2025년에는 중소기업의 48%가 MSP를 용하고 것으로 나타났으니, 사용할 계획을 하고 있던
중소기업은 대부분 계획대로 이행되었음을 다.
2.2 클라우드 지출 비용 최적
2.2.1 퍼블릭 클라우드 비용 증가로 증가
2025 고서 따르면, 1,200 달러 이상 퍼블 클라 출하 조직 비율 29%에
33%로 증가했다. 엔터프라5) 우는 36%에 40%로 증가했다. 이는 앞서 퍼블 우드에서
-스로 크로 수율 21% 되는 것과 것으 보일 있으, 그만 많은
로드 클라우드 이동거나 라우드에 미한다.
우드 비용 적화 것인가라 민거리를 많은 기업 사한다.
2.2.2 클라우드 비용 최적화에 대한
기업이 클라우드 전략을 수립하고 전략에 기반한 목표를 달성하는 평가 기준을 다양하게 설정하고
있다. 효율성/절감, 워크로드 마이그레이션 수준, 속한 리버리 등이다. 이중 '비 효율성/절감'
지표를 용하는 기업 비율이 65%에서 87%로 크게 증가하면서 6 연속 최우선 지표로
자리 잡고 다. 동시에 '마이그레이션 워크로 수'를 주요 평가 지표 삼는 기업도 작년 36%에서
올해 78% 대폭 증가했다. 러한 변화는 점점 워크로드 클라우드로 이동하거나
클라우드에서 직접 개발되는 추세속에서 수반되는 비용에 대한 깊은 고민을 동시에 있음을
보여준다. 이에 '비용 피'를 중요 지표로 보는 기업 28%에서 64%로 크게 늘었다.
올해 특히 주목할 만한 변화는 '비용 회피' 지표의 증가이다. 비용 회피는 BYOL(기존 보유 라이선스
사용), 사용량 기반 결제 절한 라이선스 관리를 통해 달성할 있다. 다시 해, 기업은
5) 종업원 1,000명 이상의 기업을 ‘엔터프라이즈’로 구분.
- 6 -
이제 단순히 '클라우드로 옮기는 것'뿐만 아니 '클라우드에서 얼마 비용 효율적으로 운영하는지'에
관심을 기울이고 있으며, 프트웨어 라이선 리가 전체 클라우드 비용 최적화의 중요한
부분으로 부각되고 있다.
2.2.3 핀옵스(FinOps) 도입
비용 최적화에 대한 기업의 민은 핀옵스 확대로 나타나고 있다. 2025년 보고서에서는 핀옵스
팀을 보유한 조직의 비율 2024년 51%에서 59% 증가했다. 핀옵스 팀이 없고 이를 위한 전략
고민하고 있지도 않다 응답한 비율은 20%에서 14%로 감소했다. 이는 핀옵 실무가 계속해서
주목받고 있으며, 조직 전반에 걸쳐 핀옵스 구현이 1년 많이 증가할 것임을 암시한다. 핀옵스
팀이 제를 시작하며 조직 전반에서의 클라우드 낭비는 감소하고 있는 으로
내부에서 판단하고 있는 것으로 보인다. IaaS PaaS에 대한 예상 클라우드 낭비는 2022년 32%의
최고치에서 계속 감소하여 2025년에는 27%에 도달했다. 이는 핀옵 직의 할이 실질적으로
재정적 이점을 제공하고 있음을 사한다.
2.3 생성 AI AI/ML 서비 도입 현황
2.3.1 생성형 AI 서비스 채택의 폭발 성장
2025년 플렉세라 보고서에서 가장 주목할 만한 변화 하나 생성형 AI(GenAI)
인공지능/기계학습(AI/ML) 서비스의 격한 채택 가다. 2025년 플렉세라 보고서에는 처음으
생성형 AI를 모든 조직이 사용하는 퍼블릭 클라우드 서비스 션으로 포함하였으며(그림 1), 이는 즉시
높은 채택률로 나타났다.
- 7 -
2025년에는 응답자의 72% 생성형 AI를 실제 사용한다 답을 했으며 이중 절반은 광범위한
분야에서 일상적으로 사용하고 다고 했다. 2024년에는 클라우드 비스 항목에 생성형 AI가
있지는 않았지만, 별도 활용도를 질문하였는데, 이때 47%가 사용하 있다고 답을 했으며
광범위하게 용하고 있는 조직은 25%에 달했다. 생성형 AI와 이를 제외한 AI를 금년에 처음으
구분하여 조사한 바에 따르면 실험 중’ 카테고리에서 생성 AI가 33%로 이를 제외한 AI 30%보다
높게 나왔다. 클라우 서비스 항목 ‘실 중’ 카테고리에서는 각각 1위와 2위이다. 사용하지
않는다고 답을 케이스는 2024년 14%에서 1%로 급격히 감소했다.
2.3.2 퍼블릭 클라우드의 AI/ML 서비스 채택 추세
생성형 AI를 제외한 AI/MA만 살펴보면 사용 비율은 2024년 41%에서 2025년 49%로 증가했고,
실험 중으로 응답한 비율은 32%에서 30% 었다. 미로운 점은 으로 활용할 계획이 있다는
응답이 17%에 12% 많이 떨어 것이다. 2025년도에는 생성형 AI가 별도 조사 목으로 나와
있기 때문에 아마도 답자의 상당수가 이미 생성형 AI를 활용하거나 혹은 계획을 가지고 있어도
생성형 AI 비중 높아서 나온 결과가 아닐까 생각한다. 엔터프라이즈나 SMB 수치는 차이가
있지만 추세는 동일하다.
AI/ML 서비스 증가와 데이터 웨어하우스 서비스 사용도 눈여겨볼 부분이다. 조사 대상 전체
응답 기준 2024년 65%에서 2025년 74%로 증가했으며, 이는 AI 모델 훈련 위한 데이 준비
관련이 있을 가능성이 높다.
2.4. 지속능성 탄소 자국
2.4.1 지속가능성 이니셔티브
2025년도 조사에서도 지속가능성에 대한 조사를 전년도와 마찬가지로 실시했지만 조사 항목을
세분화했다. 2024년도에 “당신의 조직은 탄소 발자국을 포함 지속가능성을 위한 해진 계획
있는가?”라 질문에 대한 으로 그렇다”, “아니다”, “모르겠다”, 가지 택지가 주어졌다면,
2025년도에는 여기에 “지금은 아니지만 1년 안에 정할 것이다”와 “1년 뒤에 정할 것이다” 가지
선택지가 추가되었다.
2024년 그렇다”의 비중이 48%에서 2025년 36% 떨어진 면, “계획 없다” 답도 45%에서
- 8 -
27%로 떨어졌다. 선택 항의 가에 따른 업의 답변이 갈려서 나온 결과로 있다.
그럼에도 불구하고 이를 눈여겨보아야 이유는 많은 조직에서 지속가능성보다 비용 절감을 높은
우선순위에 두고 있기 때문이다. 57%는 지속가능성보다 비용 최적화를 우선시한다고 답을 했으며 이는
2024년도의 59%와 이가 다. 선순위를 동등하게 보거 혹은 지속가능성이 높다고 보는
비율도 2024년 2025년 모두 거의 비슷한 준이다. 내부적 요구사항과 정부 규제를 통해 의무화된
지속가능성 요구사항이 계속 영향을 미쳐야 지속가능성 우선순위가 높아질 텐데, 클라우드 산업을
주도하는 미국 트럼프 정부의 친환경 정책이 쇠퇴함 따라 내년에도 개선을 기대하기는 려울 것으로
보인다.
2.4.1 유럽과 북미지역 비교
유럽도 지속가능성 대한 이니셔티 사에서 계획을 가지 있다고 답한 비율 56% 대비
43%로 어들었지만, 북미지역의 32%에 비하 여전히 높은 비율을 유지하고 있다. 이러한 계획
없다는 37%에 17%로 떨어졌지만, 역시 2025년도에 문항 옵션 늘어난 것에 일부
기인한다. 계획이 없다고 답한 북미지역의 37%보다는 여전히 매우 양호한 수준이다.
3. 나가며
플렉세라 보고서는 에서 개한 동향보다 훨씬 많은 카테고리에서 조사 과를 함하고 있지만,
이슈 리포트에서는 필자의 주관적인 판단하에 기업의 경영자 또는 고위 IT 관리자가 특히 관심을
가질 만한 위주로 정리하였다. 전략 수립의 관점에서는 클라우드 비용 관리를 위한 거버넌스 체계,
특히 핀옵스 조직을 포함한 중앙 클라우드 (CCOE: Cloud Center of Excellence) 역할의 중요성을
더욱 강조하고 다. 이는 단순 비용 효율의 목적뿐만 아니 탄소 발자국 포함한 지속가능성의
측면에서도 매우 중요하다. 아울러 핀옵스 IT 자산 관리(ITAM) 간의 밀한 연결이 필요하다.
2025년 클라우드 활용 트렌드는 클라우드 비용 관리의 전략적 중요성 대, 생성형 AI를 중심으로
인공지능 기술의 활발한 도입, 그러나 아직은 다소 만족스럽지 못한 속가능성 전략으 요약할
있다. 생성형 AI의 급격 성장은 기업 클라우드 도입 확산 전략에 가장 요한 변수로
작용하게 것이다.
- 9 -
02 -AI (Data Lake)
│Senior Program Manager 김영욱
들어가며
2025 2월, 세계에서 가장 많은 비즈니스 보유 하나 SAP와 선도 이터
폼을 공하 브릭스가 략적 트너 통해, SAP 즈니 데이 클라드에
터브릭스 데이 통합 서비 ‘SAP 이터브릭’를 했다.6) AI 시대
인저 것으 대를 모으 있는 일관 이터
넌스 환경 제공. SAP 시스템에 성된 구조화된 비즈니스 데이 데이 레이 저장
이터 원활하게 통합 준다. 이를 통해 기업 이터 레이
대한 양의 데이 SAP의 비즈니스 프로 컨텍 에서 있게 된다.
터브릭스 크하우스 아키처는 데이 레이 유연성과 데이 어하우스 구조화된 성능
하여, SAP 비즈 데이 기타 스의 이터 통합 분석 있는 환경 제공. 이러
벽하 용하 인사이트 얻고 데이 의사
강화 준다. , SAP 태계 내에 이터 합, AI 구현,
해지며, 이를 탕으 도화 석, AI 활용 사례, 그리 이전 구현 기능
이다. 이런 종류 파트 모두 상호 보완 가치 제공, 데이 레이
통해 데이 중심 전환 속화하고 경제에서 화하 .
그림 2 SAP 데이터브릭스를 포함한 SAP솔루션 (출처: SAP)
7)
6) SAP, SAP and Databricks Open a Bold New Era of Data and AI, Feb 13, 2025
- 10 -
데이터 레이크와 사용 범위
데이터 저장 엔지니어링을 이야기할 데이터 레이크와 함께 비슷한 개념의 데이 웨어하우스가 있다.
정형화된 데이터를 구조화하여 저장하는 최적화 기술이 데이터 웨어하우스라면, 데이터 레이크는
정형화된 데이터를 포함 정형화된 양한 유형 데이터를 유연하게 관리하기 위한 저장소이다.
데이터 웨어하우스는 데이터 저장 전에 정제 과정을 통해 구조화되지만, 데이터 레이크는 데이터가
처음 상태 대로 저장되어 필요에 따라 가공과 분석 있다는 점에서 차이 있다.
데이터 레이크는 기존 데이터 관리 방식의 계로 인해 탄생하게 되었다. 기업의 조직은 데이터
분산 관리되고, 저장하는 데이터의 80~90%가 텍스트, 비디오, 오디오 비정형 데이터로 성되어
있어 정형 데이터 저장에 최적화되어 이터 웨어하우스의 효용 한계가 있다. 년간
디지털 트랜스포메이션을 통해 직/부서 데이터를 통합하 과적으로 저장하 석하는 업무
요구되었는데, 형·비정형 이터를 통합적으로 저장 있는 데이터 이크가 등장하고
주목받게 되었다.
데이터 레이크 IT, 헬스케어, 리테일 다양한 산업에서 모델 구축을 위한 핵심 기술로
활용하고 있는데 특히 최근에 데이터 사이언스 머신 닝을 비롯하여 대규모 데이터를
분석하고 이상 징후를 탐지하는 영역까지 확장 이다.
국내 모범 가지 들어보자.
카카오게임즈는 온프레미스 환경에 AWS 기반 데이터 레이크 마이그레이션 다.8)
서비스에서는 실시간 데이터 분석이 요한데, 프레미스 경에서는 규모 데이터 처리 속도가
느려지고 지보수 비용이 가하는 문제 있었다. 카카오게임즈는 데이터 레이크를 도입하여
데이터를 보다 효율적으로 저장하고 분석할 있었으며, 게임 설치 수, 사용자 유지율 다양한 성과
지표를 관리할 있게 되었다. 또한, 용자 데이터를 합으로 사이트를 확보하여 사용자
경험을 향상시키고, 이탈률을 낮추어 매출 증대 효과를 얻었다. 덧붙여 AI 머신 러닝을 활용한
자동화된 분석 환경을 구축하여 실시간 모니터링 보안 대응을 구현한다.
7) https://news.sap.com/2025/02/sap-databricks-open-bold-new-era-data-ai/
8) AWS, 카카오게임즈 - 대용량 데이터 레이크 이그레이션 사례 공유, May 26, 2023
- 11 -
그림 3 AWS 이터 레이크를 활용한 카카오게임즈의 데이터 분석 아키텍처 (출처: AWS)
시스템 반도 패키징 분야 국내 기업 네패스는 대규모 이터를 리할 클라우드 이터
레이크를 구축하고, 전사 데이터를 합한 모범 사례가 있다. 노우플레이크 데이터 레이크를
도입하여 AI 모델 배포 니터링을 자동화하는 MLOps 환경을 구축하고, AI를 통한 의사 결정
프로세스를 실행하여 40%의 데이 상, 35% 비용 절감, 70% 저장공간 절감을
실현하였다.9) 데이터 레이크는 이처럼 다양한 산업에 데이터 활용의 효율성을 높이는 기여하며,
실시간 분석과 머신 닝을 통해 기업의 의사결정을 보다 효과적으로 지원한다.
AI와 결합한 데이터 레이크
데이터는 현대 비즈니스 환경에서 기업의 중요한 자산이다. 특히 AI 기술의 발전과 데이터의
저장, 처리, 분석 방식도 진화하고 있으며, 이러한 흐름 에서 최근의 데이터 레이크와 AI의 결합은
데이터 활용의 새로운 발전을 보여준다. 새로운 변화에 대해 아보자.
벡터 데이 레이
벡터는 데이터 포인트의 학적 표현으로, 이미지나 텍스트와 같은 복잡한 데이터의 특성을 인코딩하는
다차원 배열이다. 기존의 벡터 이터베이스 세부적이고 차원적인 데이터를 관리하고 검색하는
9) Snowflake, 네패스, 공장 생산 지능화 측화를 위해 Snowflake 기반의 데이 이크하우스 구축
- 12 -
중요한 역할을 해왔다. 그러나 방대하고 역동적인 데이 시스템과의 원활한 통합 측면에서는 계가
있었다. 특히 AI 머신 러닝 야에서 이러한 계는 두드러졌는데, 데이터의 규모와 다양성이
알고리즘의 효과를 좌우할 있기 때문이다. 이러한 배경에 벡터 이터 레이크는 기존 벡터
데이터베이스의 복잡성과 한계를 극복하기 위해 등장했다.
벡터 데이터 레이크의 주요 특징 임베딩(Embedding)이다. 베딩은 텍스트, 이미지 또는 운드와
같은 잡한 이터를 벡터 형태 환하여 산적으로 관리하기 쉽게 든다. AI 작업에
필수적인 요소로, 특히 생성형 AI 서비스에 중요하다. 생성형 AI는 주로 비정형 데이터를 다루며,
이러한 데이터는 고차원 벡터로 표현된다. 벡터 유사성 검색을 통해 생성형 AI 델은 정확하고
관련성 높은 결과를 생성할 있다.10) 벡터 데이터 레이크는 다양한 소스에서 수집된 데이터를
통합하여 저장하고, 이를 기반으로 AI 모델의 학습 추론을 행한다.
AI 키텍에서 데이 레이크 통합
데이터 레이크 AI 포넌트 구조 다양한 방식으로 통합된다. 데이터 처리 분석 측면에서
데이터 레이크는 확장 가능한 이터 처리 레임워크를 지원하여 AI 포넌트가 대규모 데이터셋에서
복잡한 석, 특성 추출 모델 련을 행할 있게 한다.11) 데이터 레이크 아키텍처 데이터의
수집, 저장, 처리, 석에 이르는 전체 데이터 이프라인을 지원하며, 이는 AI 시스템의 핵심 인프라가
된다. 특히 실시간 데이터 처리 기능은 AI 모델이 최신 데이터를 기반으로 지속적으 습하고 개선될
한다.
데이터 레이크를 AI 아키텍처에 통합하면 다음과 같은 가지 주요 이점이 있다.
1. 통합 데이터 저장소: 다양 소스의 데이터 한곳에 모아 AI 모델이 풍부한 데이터셋으로
학습할 있다.
2. 고급 분석 머신 러닝: 정형, 비정형 데이터 모두 처리 있는 유연성 제공하여,
정교한 AI 모델을 개발할 있게 한다. 데이터 레이크 유연성은 빠르게 변화하는 AI 요구사항에
적응할 있게 한다.
3. 실시 분석 기능: AI 시스템이 타임 크리티컬한 중요한 결정을 내릴 있게 하며, 이는 금융,
의료, 제조 다양 산업 분야에 사용된다.
10) IBM, What is a vector database?, Jul 29, 2024
11) Estuary, Data Lake Architecture: Components, Diagrams, & Layers, Jun 29, 2023
- 13 -
AI 데이 구조의 발전
AI 기술의 발전은 이터 레이크 구조와 기능에도 향을 미치고 있다. LLM은 데이터 레이크
이질적인 데이터에 대한 구조화된 뷰를 생성하여 비구조화된 데이터를 쉽게 쿼리하고 분석할 있게
한다.12) 데이터 구조 측면에서 벡터 데이터베이스는 데이터를 고차원 터로 저장하여 AI 모델이 빠른
유사성 검색을 수행하고 복잡한 쿼리를 효과적으로 처리할 한다. 식은 특히 자연어 처리나
이미지 인식과 같은 AI 응용 로그램에서 중요하다.
AI에서의 프레임 개념은 형화된 상황을 나타내는 이터 구조로, AI 시스템에 율적인 추론과
이해를 위해 지식을 하위 구조로 조직화한다. 이러한 개념은 데이 이크에서 지식 표현과 검색
향상시키는 적용될 있다. 위상 데이터 구조는 위상학의 개념을 통합하여 AI가 여러 엔티티 간의
상호 작용이나 잡한 구조와 같은 고차 관계를 가진 데이터 처리할 있게 한다.
모델이 전역 의존성과 질적 속성을 포착하는 력을 강화한다.
AI와 접목된 이터 레이크 트렌드는 이터 관리와 AI 애플리케이션 개발 새로운 패러다임을
제시하고 있다. 특히 벡터 이터 레이크의 장은 생성형 AI와 고급 애플리케이션을 지원하는
중요한 발전이다. 편, AI 기반의 다양 데이터 구조와 처리 방식 데이터 레이크의 능과 효율성을
높인다. 러한 발전은 기업이 정형 데이터를 포함한 모든 데이터 자산을 효과적으로 활용하여
정교한 AI 솔루션을 구축할 해준다. 데이터 이크와 AI의 통합은 더욱 긴밀해질 것이며,
이는 데이터 기반 의사결정과 자동화된 능형 시스템의 발전을 가속화 것으로 망한다.
데이터 레이크 솔루션 리딩 기업
데이터 레이크 솔루션 제공 업의 특징과 내용에 알아보자.
데이터브릭스(Databricks)
데이터브릭스는 빅데이터 처리를 위한 오픈소스 분산 컴퓨팅 시스템인 아파치 스파크를 기반으로
통합 데이터 분석 플랫폼을 제공하며, 이를 레이크하우스(Lakehouse) 아키텍처라고 부른다.
데이터브릭스의 가장 차별점은 데이터 엔지니어링, 데이터 사이언스, 그리고 머신 러닝을 단일 협업
12) Arxiv, Language Models Enable Simple Systems for Generating Structured Views of
Heterogeneous Data Lakes, Mar 7, 2025
- 14 -
환경으로 통합했다는 점이다. 이는 팀이 대용량 데이터셋을 효율적으로 처리하고 분석하여 AI 모델을
개발하고 배포하는 과정을 원활하게 만들며, 데이터 레이크하우스 아키텍처를 통해 데이터 레이크의
유연성과 데이터 웨어하우스의 성능을 결합하여 AI 워크로드를 효과적으로 처리할 있도록 원한다.
이를 통해 벡터 데이터베이스와 통합이 용이하며, 고차원 데이터를 효율적으로 저장하고 처리할
한다.
또한 데이터브릭스는 텐서플로우 파이토치와 같은 인기 있는 ML 라이브러리와 원활하게 통합되어 AI
모델 구축, 훈련 배포 과정을 단순화한다. 아마존과의 협업을 통해 AWS의 트레이니움(Trainium)
AI 칩을 활용하여 기업이 자체 AI 델을 맞춤화하거나 구축하는 움이 되는 서비스를 공할
계획이며, 이를 통해 AI 개발을 빠르고 비용 효율적으로 드는 것을 표로 한다. 그러나
데이터브릭스는 AI/ML 모델 개발 고급 데이터 사이언스 분석에 중점을 두고 있어, 보다 단순한
분석 요구사항을 가진 기업에는 과도한 선택일 있다. 고급 분석 기능을 최대한 활용하기
위해서는 상당한 기술적 전문 지식이 필요할 으며, 기능 대한 추가 비용이 발생 있고
사용량 기반 과금이 측하기 어려울 있다는 우려 있다.
그림 4 데이터브릭스 데이터 이크 구조 (출처: 데이터브릭스)
- 15 -
스노우플레이크(Snowflake)
스노우플레이크는 데이터 웨어하우징과 데이터 레이크 기능을 결합한 클라우드 네이티브 데이터
플랫폼을 제공한다. 완전 관리형 서비스로, 고객은 기본 인프라를 구축하고 유지할 없이 데이터를
저장, 처리 분석 있다. 스노우플레이크의 주요 강점은 스토리지와 컴퓨팅을 분리하여 리소스를
독립적으로 확장할 있게 함으로써 성능과 비용 효율성을 최적화한다는 점이다. 또한 다양한 조직
플랫폼 간의 안전하고 효율적인 데이터 공유를 촉진하여 협업을 화한다. 사용자 친화적인
인터페이스로 설계되어 빠른 배포와 최소한의 유지보수가 가능하며, 다양한 기술 수준을 가진 용자가
접근할 다. 스노우플레이크는 주로 데이터 어하우징 솔루션이지만 다양한 AI ML 도구
통합되어 사용자가 스노우플레이크 저장된 데이터를 사용하여 고급 분석을 수행하고 AI 모델을 축할
한다. 이를 범위한 데이터 마이그레이션 없이도 AI 애플리케이션 개발을 지원한다.
그러나 스노우플레이크는 이터 분석 비즈니스 인텔리전스에 중점을 기업에 합하고, 복잡한
데이터 사이언스 워크플로에는 제한적일 다. 또한 사용량 기반 과금 모델로 대용량 데이터와
복잡한 쿼리 사용할 경우 비용이 급증할 위험이 있으며, 완전 관리형 서비 특성으로 고도
커스터마이징이 한될 다는 우려 사항이 있다.
그림 5 스노우플레이크 아파치 아이스버그를 활용한 개방형 데이터 레이크 구축하기 (출처: 스노우플레이크)
- 16 -
AWS
AWS는 Amazon S3 레이크 포메이션(Lake Formation)과 같은 서비스 제공하여 고객이
데이터 레이크를 축하고 관리할 한다. 또한 데이터 처리를 완전 관리형
서비스도 제공한다. AWS의 주요 강점은 스토리지, 컴퓨팅, 머신 러닝을 포함한 다양한 통합 서비스를
제공하여 다양한 비즈니스 요구사항 대한 종합적인 솔루션을 제공한다는 점이다. 또한 기업
요구사항에 따라 활하게 확장할 있는 실질적으로 제한의 스토리지 퓨팅 리소스를 제공하며,
강력한 보안 조치와 준수 증을 구현하여 데이터 보호 준수를 보장한다.
AWS는 세이지메이커(SageMaker)를 포함한 AI ML 서비 제품군을 제공하여 개발자가 ML
모델을 대규모로 구축, 훈련 배포할 있도록 지원한다. 이러한 서비스는 다른 AWS 제품과
원활하게 통합되도록 설계되어 AI 개발을 위한 일관된 환경을 제공한다. 벡터 데이터베이스와의 통합을
통해 고차원 데이터를 효율적으로 처리하고, 유사성 검색과 같은 기능을 현할 있게 한다.
또한 AWS는 트레이니엄 인퍼렌시아(Inferentia)와 같은 특수 AI 칩을 개발하여 AI 워크로드의 성능
효율성을 개선했다. 이는 그러나 AWS는 다양한 서비스 옵션으로 인해 초기 설정 관리가
복잡할 으며, 다른 관리형 루션에 비해 많은 관리 업이 필요할 있다.
또한 다양한 서비스 사용에 따른 복잡한 비용 조로 관리에 어려움이 있을 다는
사항이 있다.
그림 6 베드록과 아테나를 활용한 AWS 데이터 레이크 에이전트 구조 (출처: AWS)
- 17 -
마무리
AI 시대에 접어들면서 기업의 데이터 활용 방식 근본적인 변화를 맞이하고 있다. 변화의 중심에는
데이터 레이크가 있는데, SAP와 데이터브릭스의 전략적 파트너십에서 있듯이 기업은 데이터
관리와 AI 합으로 새로 치를 창출하고자 한다. 특히 이터의 통합성, 근성, 그리 용성이
AI 대에서 매우 중요한데, 과거 사일로화된 이터 환경에서는 부서별로 이터가 분산되어 있어
전체적인 인사이트 얻기 어려웠다. 러나 현재는 데이 레이크를 통해 정형 데이터와 비정형 이터
모두 한곳에 모으고 AI와 연결함으로써 실시간 의사결정, 예측 강화, 비용 율성, 벡터 데이터
처리, 확장 연성 등을 험할 있게 되었다. 데이터 레이크를 통해 AI 모델이 학습할
다양하고 풍부한, 넓은 관점의 데이터를 제공하면, AI는 이를 기반으로 의미 있는 패턴과 인사이트를
발굴한다. 이를 통해 기업은 데이터 기반 의사결정을 가속화하 비즈니스 프로세스를 최적화할
있다. 데이터와 AI의 효과적인 합은 기업들이 빠르게 변화하 비즈니스 환경에 성공적으로
경쟁하고 성장하기 위한 필수 요소가 되었다.
- 18 -
03 AI
│한상기 테크프론티어 대표
중국의 주요 클라우 기업 즉, 알리바바, 화웨이, 텐센트 2024년 3분 기준으로 중국 장에서
각각 36%, 19%, 15% 점유율을 있으 중국 시장 70%를 차지하는 수준이다.
그러나 세계 시장으로 보면 리바바가 4% 수준이며 나머지는 모두 1% 머물고 있다.
세계 클라우드 컴퓨팅 시장이 2025년 9,128억 달러 수준으로 예상하며, 마켓앤마켓의 예측으로
15%의 성장을 이루어 연말에는 1조 2,568억 달러로 성장할 것으로 보고 있다. 중국 시장은 AI 통합
등으로 성장이 이루어질 것으로 보는데, 전체 시장의 성장이 8%로 글로벌 시장에 비해 작은 숫자를
보이지만, AI 관련 서비스는 르다.13)
알리바바의 AI 서비스는 분기에 200% 장하고 으며, 웨이 역시 팡구(Pangu) 5.0 파운데이션
모델 발표 이후 13% 성장률을 보인다. 텐센트는 AI 모델로 고객을 끌어들이기 위해서 1억 개의
공짜 토큰을 제공하고 있다. 알리바바 클라우드, 바이두 AI 라우드, 텐센트 클라우드, 화웨이
클라우드를 포함한 중국의 주요 클라우드 퓨팅 기업은 모두 딥시크 AI 모델을 자사 플랫폼에
통합했다. 중국 클라우드 기업에게 AI는 다른 성장 동인이 다고 보고 있는 것이다.
해외 시장에 대한 직임도 속적으로 보이는데, 알리바바는 처음으 멕시코 데이터 센터를
구축했다.14) 이는 라틴 아메리카에 처음 출한 것이고 이를 통해 시코 회사와 발자들에게
클라우드 컴퓨팅 서비스를 공하겠다는 의지를 보였다. 멕시코 시설은 알리바바가 2월 순에 국에
번째 데이터센터를 운영 작한 6일 만에 발표한 것이다. 태국에서 축한 번째 데이터센터는
2022년이며, 이후에 아시아에서 이터센터를 늘리겠다는 발표를 했다.
알리바바는 이제 29개 리전에 87개의 존을 있다. 해외는 음과 같다.
13) China Internet Watch, “China’s Cloud Service Spending Reaches $9.4 Billion in Q2 2024, Led
by AI Integration,” Oct 10, 2024
14) ECNS, “Chinese cloud computing companies expanding abroad,” Mar 10, 2025
- 19 -
그림 7 알리바 클라우드의 해외 리전과 존이 있는 국가
알리바바는 향후 3년 동안 클라우드와 AI 하드웨어 인프라에 523억 달러에 해당하는 3,800억 위안을
투자하겠다고 발표하기도 했다. 15)
알리바바는 AI 파운데이션 모델 개발에도 적극적인 글로벌 준에서도 뛰어난 모델을 개발하고
있다. 클라우드에서 딥시크를 제공하겠다고 했으면 자체 룹인 큐웬 시리즈를 오픈 소스
제공하고 있다.
지난 1월에는 GPT-4나 클로드 3.5 소넷, 딥시크-V3 같은 사전 기반 모델을 능가하
Qwen-2.5-맥스를 발표했다. 이는 20조 개의 토큰으로 습한 모델로 SFT(지도 미세 조정), RLHF
(사용자 피드백을 통한 강화학습), 대규모 전문가 모델(MoE) 방식으로 구현했다.
Qwen-2.5-맥스는 API 근하며 알리바바 클라우드 모델 튜디오 서비스로 활용할 있다.
Qwen의 API는 오픈AI의 API 호환 능하기 때문에 오픈AI API 사용 관행을 따른다.
알리바바의 시리즈에는 대규 언어 비전 모델인 Qwen-VL, 대규모 언어 디오 모델인
Qwen-Audio, 코딩 모델인 Qwen-Coder, 학적 모델인 Qwen-Math, 추론 모델인 QwQ-32B가
있다. 중에 QwQ-32B는 320억 개의 파라미터를 가진 델로, DeepSeek-R1과 유사한 성능을
보였다.16) 델은 대규모 모델의 지능을 강화하기 위해 강화 학습(RL)을 활용했으며,
Qwen-2.5-32B를 반으로 했다. 딥시크-R1의 열풍이 부는 운데 알리바바 뛰어난 모델을
선보일 음으로 AI에서 리더십을 잃지 않았음을 보여준 것이다.
15) Reuters, “Alibaba to invest more than $52 billion in AI over next 3 years,” Feb 24, 2025
16) Alibaba Cloud, Alibaba Cloud Unveils QwQ-32B: A Compact Reasoning Model with
Cutting-Edge Performance,” Mar 6, 2025
- 20 -
그림 8 알리바바 클라우드 모델 스튜디오 개념도
2위 기업인 화웨이는 델아츠(ModelArts)라 AI 플랫폼을 제공하고 있다. 통해 드투엔드 모델
개발 파이프라인, 비용 효율이 좋은 AI 퓨트, 초거대 규모의 습, 고신뢰성을 자랑하고 있다.
그림 9 화웨이 모델아츠 아키텍처
- 21 -
화웨이는 판구(Pangu)라는 멀티모달 LLM을 자체적으로 개발해서 제공하는데 최초 버전은 2023년
7월에 나왔다. 2024년 6 화웨이 발자 컨퍼런스(HDC)에서 발표한 5.0까지 나왔는데 모델은
시각적 모델, 예측 모델, 판구 자연어 모델, 다중 스타일 델, 과학적 컴퓨팅 모델을 포함하여 다양한
매개변수와 다양한 기능을 포함한다.
판구는 매개변수 규모에 따라 4개의 시리즈로 제공한다.
Ÿ판구 E 시리즈: 10억 개의 매개변 수준 갖춘 휴대폰, 태블릿, PC 기타 장치에서 스마트
앱을 지원한다.
Ÿ판구 P 시리즈: 100 개의 매개변수 레벨을 유하고 있으며 지연 저비용 건에
적합하다.
Ÿ판구 U 리즈: 인은 1,350억 2,300억 매개변수의 가지 변형으로 제공한다.
복잡한 작업을 관리할 있으며 대형 모델의 기반으로도 사용할 다.
Ÿ판구 S 시리즈: 단위 개변수를 포함하고 있으며, 크로 도메인이나 멀티태스킹 AI
기술 관련 상황 관리할 있다.
화웨이는 또한 업계 최초 STCG(space-time controllable generation) 기술을 새로 모델에
통합했는데 이는 시공간 기반의 효과적인 텐츠 생성을 위한 것이다. 특히 주행, 산업 생산, 건설
등과 같은 여러 시나리오에 집중하는 움이 것이라 한다. 예를 들어 주행 분야에 실제
도로 환경 생생하게 구현하 다양한 주행 시나리오를 생성할 다. 일반적인 주행 상황부터
예측할 없는 도로 환경, 사고 급격한 변화가 구되는 등을 영상을 생성해 동차
기업이 자율 주행 시스템을 효율적으로 학습시킬 있도 지원한다.
2024년에 화웨이 판구 모델을 30개 이상의 산업에 배치했고 교육, 금융, 의료 연구, 정부 업무, 석탄
채굴, 철강, 철도, 주행 400개 이상의 다양한 시나리오에서 사용했다고 한다.
중국 클라우드 3위에 있는 텐센트는 AI 클라우드 서비스를 용하여 해외 기업 디지털
전환을 실현하도록 지원하는 박차를 가하고 있다. 사는 최근 사우디아라비아에 번째 중동
데이터 센터 설한다고 표했는데, 향후 수년 동안 프라 건설에 1 5천만 달러 이상을
투자하여 회사의 글로벌 확장에 중요한 단계를 밟았다.
텐센트 클라우드 인터내셔널 중동 아프리카 담당 부사장인 단(Hu Dan)은 새로운 데이터
센터가 디지털 디어 스트리밍, 비디오 게임, e스포츠, 전자상거래, 관광, 금융 서비스, 통신을 포함한
- 22 -
주요 분야에 사우디아라비아의 디지 혁신 여정을 지원하는 회사의 역량을 강화할 것이라고 말했다.
지난 3월에는 AI 개발과 인프라를 강화하면서 2025년에 자본 지출 늘릴 것이라고 혔는데, 자본
지출이 매출 대비 10% 초반대에 이를 것이라고 했지만 2024년 자본 지출이 1년 34억 달러에서
107억 달러로 증하여 총매출의 12%에 달한 점을 각하면 2024년에 비해 크게 증가하지는 않을
것으로 보인다. 다만 4분기에 AI 이니셔티브에 390억 위안(54억 달러)을 지출한 것을 보면 AI에 대한
의지는 강하다. 그러나 톡의 모회사인 바이트댄스가 2025년 지출에 1,500억 위안 이상을
책정했다고 보도하면서 주로 AI 개발과 퓨팅 성능 집중할 이라고 것과 교하면 상대적으로
크다고 없다.
텐센트 역시 딥시크-R1을 능가하는 증형 AI 모델 개발했는데, 3월 22일에 훈유안(Hunyuan)
T1이라는 모델을 오픈 소스로 개했다.17) 딥시크와 마찬가지로 합성 데이터를 활용한 강화학습으로
성능을 였는데, 딥시크 R1과는 일부 벤치마크에서 앞서거나 대등한 수준 보였다. 가장 장점 가격
경쟁력이다.
특이한 점은 트랜스포머 키텍처와 바(Mamba)를 결합 하이브리드 조를 반으로 하는데,
하이브리드 방식은 메모리 사용량을 줄여 학습 추론 비용을 크게 줄일 있다고 다. 텐센트는
T1이 "긴 텍스트 정보를 캡처하는 기능을 보장하는 동시에 리소스 비를 크게 줄인다."고 선전했으며,
디코딩 속도가 200% 증가했다고 밝혔다.
회사는 딥시크-R1을 클라우드 플랫폼과 유안바오(Yuanbao) 챗봇에 통합하여 자체 훈유안 모델과
함께 대안을 제공하고 있으며 이는 자체 개발 타이틀과 독립 스튜디오의 타이틀을 홍보하여 비디오
게임 산업을 지배한 식과 유사한 접근 방식이라는 평가를 는다.
딥시크 V3와 R1을 통해 AI 분야에서 중국의 자존심이 크게 올라가고, 중국 정부 모든 산업에
기술을 활용하라는 정책을 펼치고 있다. 중국의 주요 클라우드 업체 연히 딥시크를 AI 서비스
안에서 공하게 되었지만 그동안 AI 모델 개발을 꾸준히 기업의 입장에서는 시크 못지않은
모델 개발에 박차를 하게 했다. 알리바바 텐센트는 딥시크 능가하거나 이제 적하는 수준의
모델을 속속 공개하기도 했다.
17) SCMP, “Tencent’s Hunyuan T1 AI reasoning model rivals DeepSeek in performance and price,”
Mar 22, 2025
- 23 -
오픈 소스를 통한 세계 AI 시장 공략을 전략의 핵심으로 삼은 중국의 입장에 맞추면서 알리바바,
화웨이, 텐센트 모두 해외 데이 센터 대를 하드웨어 프라를 갖추고 있다. 또한 딥시크로
인지도가 라간 시점을 활용해 해외 파트너를 확대하고 외국 시장에서 존재감을 키우고 있다. 하나의
기술 혁신이 나라의 주요 기업에게 새로운 사업 확장 기회를 제공하게 만든 좋은 사례가 되고 있다.
- 24 -
04 -
│정채상 인이지 연구소 기술 책임자
들어가며
지난 편의 클라우 기반 스마트팩토리에 대한 소개에 이어 이번 에서는 현장에서 제로
부딪히는 문제들을 정보통신의 관점에서 몇몇 사례 야기 보겠다. 아래 내용들은 필자가
함께하는 인이지를 비롯한 여러 회사들이 제조 공정 관련한 제들을 수행하면 제들과 이들을
해결하려는 방법들에 관한 내용들이다.
제조 산업에서도 스마트팩토리라는 키워드를 중심으로 여러 혁신의 노력들이 모이고 있고, 클라우드를
이용한 기술은 효율성과 유연성을 극대화하는 요한 역할을 하며, 정보통신 업계에서 노하우들을
다양하게 적용하면서 영향력을 넓혀 가고 있다. 특히 클라우드 용한 방법을 통해서는 다음과
같은 이득을 기대할 있다.
Ÿ데이터 기반 의사 결정
Ÿ유연성과 확장성
Ÿ비용 효율성
Ÿ디지털 전환(DX)의 가속화
이는 일반적으로 쓰이는 의미의 IT 시스템 도입과 이전으로 인한 이득 같은 맥락이지만,
스마트팩토리는 현장의 물리적인 변화와 공정의 특성들을 고려할 단순한 IT 시스템 이전과는 다른
추가적인 복잡한 문제들이 발생한다.
Ÿ물리적 한계와 엔트로피 문제
Ÿ실시간 운영과 신뢰성 문제
Ÿ데이터 관리의 어려움
Ÿ디지털 전환과 문제 가능성
이번 회에서는 추가적인 용들에 대해 구체적으로 살펴보겠다.
- 25 -
물리적 한계와 엔트로피 문제
기존의 데이터센터 중심의 IT 환경과는 달리, 스마트팩토리는 물리적 환경과 밀접하게 연결되어 있으며,
다양한 기계적 요소와 데이터가 실시간으로 상호작용하는데, 이는 예상치 못한 물리적 한계와 엔트로피
문제를 야기할 있다.
스마트팩토리는 제조 현장의 특성 생산 라인의 변화, 기계 설비의 교체, 센서 추가 물리적 변화가
빈번하게 발생한다. 이러한 변화는 데이터 흐름과 시스템 아키텍처에 접적인 영향을 미치며, 클라우드
환경과의 통합을 복잡하게 만든다. 들어, 새로운 센서 추가할 때마다 이터 수집 처리
시스템을 설정해야 고, 생산 라인 변경 이터 분석 델을 수정해 하는 등. 러한 리적
변화에 유연하게 대응하지 못하면 시스템의 효율성이 저하되고 운영 용이 증가할 있다.
또한 스마트팩토리는 다양 기계와 센서, IT 시스템이 복잡하게 연결된 시스템이다. 전선으로 연결되어
빛의 속도로 연결되는 환경이 아니라 어느 곳에서 어떤 연료를 투입하면, 몇미터 떨어진 곳의 온도가
후에 어떻게 변하는 등의 주변 상황들이 통제되지 않는 상황이 생기고, 대기의 온도, 습도 등에 따라
예기치 않은 변화들이 생기기도 한다. 시간 남에 따라 장치 마모되거나 유지보수의 부담이
늘어나는 열역학 제2법칙인 엔트로 증가의 법칙과 유사한 현상이 일어나게 되는데, 이로 인해
시스템의 안정성이 저하되고 오류 발생 능성이 높아지며, 이는 생산 효율성 저하 직결된다.
실제로 디지 전환 도입하려 많은 제조 현장의 경우 온도와 습도 등의 경이 영향을 미치기
때문에, 온프레미스 시스템을 구성하 위해서도 오차 사용 가능한 장비들의 사용이 필요하고,
여기에 특히 클라우드 환경을 도입할 경우, 온프레미스 시스템과 동, 데이터 동기화, 네트워크
안정성 추가적인 유지보수 요소가 발생하는데, 클라우 도입의 점을 제대로 누리기 위해 이들로
인한 복잡성을 효과적으로 관리해야 한다.
이후 데이터가 모여서 분석하 우, 도면이나 공정 같은 현장의 지식이 없이 센서 데이터만으로
분석의 계가 긴다. 시멘트 철강 등의 공정을 생각한다면 물리적으로 수십 미터 떨어져 있는
데이터들이며, 센서들 사이에 어떤 간섭이 있는지, 바람은 통하는지, 하루에 번씩 청소하는지
등의 내용들이 고려되어야 현장의 문제에 접근할 있게 된다.
마찬가지로 용해로 시계열 온도 예측 같은 우, 900도 도를 맞추기 위해서 850도인 현재 상황에서
용해 물질 어떤 재료를 얼마만큼 넣으면 후에 도가 라가는지 데이터 모아 놓기에
- 26 -
어려움이 많고, 산업공학, 기계공학, 화학공학 등의 정보들이 도메인 식을 익힌 후에 나은 분석을
있는 경우가 많다.
실시간 운영과 신뢰성 문제
스마트팩토리는 고도의 자동화와 데이터 기반 운영을 통해 생산성을 극대화하 것을 목표로 하는데,
이러한 목표 달성하기 해서는 실시간 운영과 스템의 높은 신뢰성이 필수적이다. 하지만
스마트팩토리 환경은 다양한 변수와 복잡성으로 인해 실시간 운영과 신뢰성을 확보하는 어려움을
겪을 있다.
스마트팩토리는 24시간, 365일 동되는 경우가 많은데, 이는 생산 효율성을 극대화하고 요에
신속하게 대응하 위한 필수적인 조건이다. 따라서 예기치 않은 시스템 다운타임은 생산 차질, 납기
지연, 신뢰도 각한 문제를 야기할 있다. 히, 실시간 데이터 처리 제어가 중요
생산 라인에서는 분의 다운타임도 재가동하는 비용을 포함한 손실로 이어질 있다. 따라서
스마트팩토리는 시스템의 안정성을 최우선으로 고려해야 하며, 다운타임 발생 신속하게 복구할
있는 체계를 구축해야 한다. 예를 들면 해로 재시작 재가동 등의 일들은 일반 컴퓨터 재부팅보다 훨씬
비해야 많으므로 이런 점이 고려되어야 한다.
또한 시스템의 신뢰성 높이기 위해서는 이중화 시스템 구축 필수적이고, 환경 따라서 데이터
백업, 네트워크 이중화, 서버 이중화 다양한 방법을 통해 시스템 장애에 대비해야 한다. 자원들이
유기적으로 연결되어 있는 클라우드 환경에서는 상대적으로 이중화 혹은 다중화 지원이 용이하지만,
온프레미스 경에서는 이를 지원하기 위해 네트워크 장비나 서버들의 추가적인 설치와 영이
필요하다.
온프레미스에 저장되어 있는 데이터를 클라우드에 저장하고 운영하는 것은 추가적인 네트워크 연결을
도입하는 것이기에 이로 인한 위험도 있게 되므로, 시간 데이터 처리 중요 데이터 프레미스에
저장하고, 분석 데이터는 클라우드에 저장하는 하이브리드 모델을 많이 려한다. 이러한
하이브리드 모델은 데이 속도와 안정성을 동시에 확보할 으며, 엣지 컴퓨팅을 활용하
실시간성이 요구되 데이터의 경우 추가적인 데이터 이동을 절약함으로써 현장에서 필요 데이터 처리
속도를 향상시킬 다.
- 27 -
그림 10 고가용 시스템 네트워크 구조 예제
18)
스마트팩토리는 수많은 마트 센서 통해 이터를 수집하 분석하는데, 클라우드 기반 마트
센서는 트워크 결이 필수적이므로, 안정적인 트워크 경을 구축해야 한다. 주변의 환경에 영향을
받기에 유무선 네트워크 장애는 센서 데이터 수집 전송에 문제를 일으킬 있고, 스마트 센서는
민감한 생산 데이터를 수집하므로, 데이터 보안을 강화해야 한다. 각각의 센서 혹은 시스템이 노출되는
형태이므로 데이터 호화, 접근 제어, 보안 프로토콜 적용 등을 통해 이터 해킹을 방지해야
하고, 마지막으로 많은 스마트 센서를 효율적으로 관리하고 유지보수해야 하는데, 원격 리, 자동
업데이트, 센서 상태 모니터링 시스템 등을 통해 센서 관리 효율성을 높여야 한다.
18) https://en.wikipedia.org/wiki/High-availability_cluster
- 28 -
데이터 관리의 어려움: 저장과 조회의 균형
스마트팩토리는 생산 과정에서 발생하는 방대한 양의 데이터를 효율적으로 관리하는 것이 핵심이다.
현장에서 일어나는 모든 데이터가 관리 대상이기에 데이터의 양이 기하급수적으로 증가함 따라 저장과
조회에 대한 어려움이 발생하고, 효율적인 데이터 전략이 필수적이다.
스마트팩토리에 생성되는 데이터 실시간 데이터와 장기 분석용 데이터로 있다. 실시간
데이터는 생산 라인 제어, 품질 검사 각적인 응답이 필요 데이터이며, 온프레미스에 저장하는
것이 유리한 반면, 장기 분석용 데이터는 생산 공정 최적화, 설비 예지 보전 등에 활용되며, 클라우드
스토리지를 활용하는 것이 좋다. 클라우드는 확장성에 확실한 강점이 어, 이후 효율적으로
저장하고 처리할 있다. 전사적 자원관리(ERP: Enterprise Resource Planning)의 내용 같이
현장 바깥의 정보들과 같이 용하는 경우 유용하게 쓰일 있다.
스마트팩토리에 생성되는 데이터는 많게는 초당 수백, 수천 건의 고화 대용량 이터들이
이용되기도 하는데, 이를 다루기 위해서 데이터 처리 성능이 중요하다. 데이터를 모으는 시스템과 읽는
시스템이 자원을 공유하기에 사이에서 오는 문제가 생기기도 한다. 실제 조회가 필요할 경우 제대로
운영하기 위해 알맞은 데이터베이스를 택하고, 덱스 설정, 쿼리 최적화 등을 통해 대응해야 하는데,
데이터를 이동시키는 드는 자원이 원래 스템을 운영하는 방해가 되지 않아야 하고, 본래
시스템이 주어진 역할에 지장이 없도록 운영해야 한다.
데이터양이 증가함에 저장 비용이 기하급수적으로 증가할 있다. 예를 들어 이미지를 통한 불량
탐지의 경우 불량률이 낮아질수록 중복된 정상 이미지들이 불필요하게 이는 상황이 생기기도 하고,
모든 것들을 저장해야 한다고 하면 데이터 백업 등에도 추가적인 노력과 비용을 들여야 다. 대용
데이터를 시간으로 처리하는 것은 클라우드 환경에서도 기술적으로 어려운데, 온프레미스에서도 분산
처리 시스템, 인메모리 데이터베이스, 엣지 컴퓨팅 다양한 법들을 도입해야 한다.
이처럼 스마트팩토리의 데이터 관리는 저장 결정, 읽기/쓰기 성능 최적화, 저장 비용 처리
한계 극복 양한 어려움을 내포하는데, 러한 문제를 해결하기 위해 먼저 현장 이해한 후에
데이터의 특성과 사용 목적에 맞는 데이터 관리 전략을 수립하고, 최신 술을 적극적으로 활용해야
한다.
- 29 -
디지털 전환과 문제 해결 가능성
디지털 환은 스마트팩토리의 생산성과 효율성을 향상시키기 위한 전략으로, 클라우드는 지털
전환의 중요한 요소로 작용하며, 데이터를 중앙에서 실시간으로 분석할 있도록 지원한다. 이를 통해
공정 최적화와 이상 탐지가 가능하며, 공장 운영의 자동화 가속화할 있다. 다양한 장점에도
불구하고, 현장의 문제를 풀어낼 있는 문제에 많은 민들이 있다.
온도를 아날로그 센서의 경우 고온고압의 경을 서가 버티지 못하는 경우도 있고, 최근의
화두인 수치의 경우 가상의 새로운 장치들이 필요하다. 제품 완성도 화면으로 100% 잡히
않는 경우도 많고, 농도는 플링에 의존 수밖에 없고, 물성은 완제품으로부터만 얻을 경우가
대부분이다. 각각의 사례들이 데이터로 디지털 되었다고 해도 세상의 리와 화학은 이진 수학으로
떨어지지 않는 부분도 많고, 통계와 예측은 신뢰구간과 끊임없는 싸움이다.
앞의 여러 이슈를 겪은 데이터가 모인 후에는, 실제 문제를 정의하고 풀어 나가는 마지막 단계에
오게 되고, 경우 인력 문제로 귀결이 된다. 이미 제조 현장은 소수의 인원이 오랜 월의 노하우로
운영을 하고 있고, 문제를 데이터로 풀려 하는 인력들과 거리가 있어 많은 현장에서 디지털 환을
했음에도 실질적인 이득을 얻기 힘들다는 현실과 닿아 있다. 거리 좁혀진 후에는 시계열 예측 혹은
설명 가능 인공지능 등이 추가적인 가치를 창출해 있겠으며, 필자가 속한 인이지를 비롯해 많은
인공지능 관련 업체들이 기존의 조산업 업체들과 문제를 정의하고 풀어 나가고 있다.
그림 11 인이지의 산업용 공정 효율 최적화 솔루션 예제
19)
- 30 -
맺으며
클라우드 기반 스마트팩토리는 분명 제조업의 혁신을 가속화하 생산성을 극대화할 있는 강력한
도구이지만, 펴본 바와 이, 물리적 한계, 시간 운영 신뢰성, 데이터 관리의 어려
해결해야 과제들이 산적해 있다. 이러한 문제들을 극복하 위해서는 단순히 기술을 도입하는 것을
넘어, 현장의 특성을 깊이 해하고, 데이 기반의 의사 결정을 통해 지속적인 개선을 추구하는 노력이
필요하다.
또한, 스마트팩토리를 포함한 디지털 환은 기술적인 변화뿐만 아니라, 문화와 인력의 변화를
수반한다. 현장의 경험과 지식을 데이터 분석 활용 력과 결합하여 시너지를 창출하는 것이
중요하겠으며, 클라우드 스마트팩토리가 정한 치를 발휘하 위해서는 기술, 사람, 그리고
조직의 화로운 발전이 필수적이라 하겠고, 소들이 고려되었을 로소 지털 전환이
되었다 겠다.
19) https://ineeji.com/html/business/features.php