반응형
🤔 문제
어느 소규모 스타트업 기업이 고객의 피드백 데이터를 수집하고 분석하기 위한 시스템을 구축하고 있습니다. 피드백 데이터는 JSON 형식이며, 매일 고객의 의견과 감상이 포함되어 있습니다. Amazon S3에 저장되는 데이터 크기는 비교적 작아서 매일 수백 킬로바이트 정도입니다. 기업은 이 데이터를 수집하고 실시간으로 분석하여 고객의 트렌드를 조사하는 것을 고려하고 있지만, 아직 본업 외에 큰 비용을 들일 여유는 없습니다. 이러한 요구 사항을 가장 비용 효율적으로 충족하기 위해 어떤 접근 방식을 취해야 할까요?
- AWS Lambda를 사용하여 Amazon S3에 업로드된 피드백 데이터를 실시간으로 처리하고, 결과를 Amazon DynamoDB에 저장하기
- Amazon EC2 스팟 인스턴스를 사용하여 작업을 실행하고, S3에서 데이터를 읽어 처리 후 결과를 Amazon RDS에 저장하기
- Amazon EMR을 사용하여 S3상의 데이터를 Hadoop으로 처리하고, 결과를 HDFS에 저장하기
- AWS Glue를 사용하여 S3상의 피드백 데이터의 ETL 처리를 수행하고, 결과를 Amazon Redshift 데이터 웨어하우스에 로드하기
정답과 문제풀이
더보기
정답. 1 번
"AWS Lambda를 사용하여 Amazon S3에 업로드된 피드백 데이터를 실시간으로 처리하고, 결과를 Amazon DynamoDB에 저장하기"
- AWS Lambda는 서버리스로 코드를 실행할 수 있는 서비스이며, 이벤트 기반으로 S3에 업로드된 데이터를 실시간으로 처리하는 데 적합하다.
- 또한 처리할 데이터 크기가 작기 때문에 Lambda의 실행 시간과 리소스 소비가 적다 → 비용을 절감할 수 있다.
- DynamoDB는 유연하고 확장 가능한 NoSQL 데이터베이스로, 실시간 데이터 분석 결과를 저장하는 데 적합합니다.
오답 이유
더보기
2번 오답 이유:
- Spot 인스턴스는 저렴하지만 항상 사용할 수 있는 것은 아니어서 실시간으로 작업을 실행할 수 있다는 보장이 없다.
- Spot 인스턴스는 도중에 중단 될 가능성이 항상 있다.
- RDS는 완전 관리형 관계형 데이터베이스 서비스로, 소규모 JSON 데이터의 실시간 분석 결과를 저장하는 데 적합하지 않다.
3번 오답 이유:
- EMR을 사용하여 S3상의 데이터를 Hadoop으로 처리하고, 결과를 HDFS에 저장하기 EMR은 대규모 데이터 처리에 적합하지만, 이 요구 사항의 작은 데이터량 처리에는 비용 효율이 좋지 않다.
- HDFS는 대량의 데이터를 저장하는 데 적합하지만, 여기서는 소규모 데이터를 다루고 있어 적합하지 않다.
4번 오답 이유:
- Glue를 사용하여 S3상의 피드백 데이터의 ETL 처리를 수행하고, 결과를 Amazon Redshift 데이터 웨어하우스에 로드하기 Glue를 사용한 ETL 처리는 축적된 데이터를 처리하는 데 적합하지만, 실시간 처리에는 적합하지 않다.
- Redshift는 강력한 데이터 웨어하우스 서비스로, 소규모 데이터와 비용 절감 요구 사항에는 적합하지 않다.
728x90
반응형
'클라우드(AWS) > SAA-C03' 카테고리의 다른 글
[AWS SAA-C03] 오답 풀이 #006 (API Gateway와 VPC Link란?) (0) | 2024.08.07 |
---|---|
[AWS SAA-C03] 오답 풀이 #005 (ACM의 인증서 만료 방지하는 방법) (0) | 2024.08.06 |
[AWS SAA-C03] 오답 풀이 #004 (CloudWatch Logs와 Metrics의 차이점) (0) | 2024.07.22 |
[AWS SAA-C03] 오답 풀이 #003 (RDS 중에 MySQL에서 Aurora로 이전하기) (0) | 2024.07.11 |
[AWS SAA-C03] 오답 풀이 #002 (VPC 엔드포인트 정책) (0) | 2024.07.01 |