반응형

안녕하세요! 오늘은 데이터 통신 및 교환에 있어 전문적이며 보편적인 언어인 XML에 대해 알아볼까 합니다.
쉽게 말해, XML은 데이터를 공유하고 전송하는 데 도움을 주는 언어로 생각하시면 됩니다.
개발자든 아니든 이 글을 통해 쉽게 이해할 수 있는 XML의 개념, 중요성, 특징들을 알게 되실 겁니다.
그럼 시작하겠습니다.

XML이란?

XML 이란 eXtensible Markup Language의 약자로, HTML과 같은 마크업 언어입니다.
1998년 W3C(World Wide Web Consortium)에 의해 개발되었습니다.
이 언어는 SGML(Standard Generalized Markup Language)에서 파생되었으며,
웹 문서의 공유를 목적으로 한 HTML에 비해 데이터의 저장과 전송에 더 적합한 구조를 제공하기 위해 만들어졌습니다.

"생각해 보세요, 우리가 커다란 나무에서 여러 가지 과일을 따듯이,
그 큰 나무가 바로 SGML이라는 기술입니다.
XML은 그 나무에서 따온 맛있는 한 종류의 과일이며,
특히 인터넷에서 정보를 주고받기 좋게 만들어진 과일입니다.
HTML도 같은 나무의 다른 과일처럼, 웹 페이지를 만드는 데 사용됩니다."

SGML의 복잡성을 단순화하여 웹 애플리케이션에서 쉽게 사용할 수 있도록 설계된 XML은
데이터의 이식성과 호환성을 크게 향상했습니다.
하지만 HTML과는 달리 웹 페이지를 만드는 것이 아니라,
웹 페이지 외부에서 데이터 자체를 표현하고 저장하기 위해 설계되었습니다.

XML 파일 구조

XML 파일은 ". xml" 확장자를 가진 파일로, 데이터와 그 데이터의 구조를 정의하기 위해 사용됩니다.
데이터와 그 구조를 명확하게 정의할 수 있으며,
이를 효과적으로 인터넷을 통해 전송하고,
서로 다른 시스템 간에 쉽게 공유할 수 있습니다.
이는 데이터를 읽고 이해하기 쉽게 만드는 데 큰 역할을 합니다.
XML 문서는 태그(tag)와 속성(attribute)으로 이루어진 계층적 구조를 가지고 있습니다.

"XML 문서를 만드는 것은 마치 큰 상자에 여러 작은 상자들을 넣고,
각 상자에 무엇이 들어있는지 적어 놓는 것과 비슷합니다.
'태그'는 상자에 붙은 라벨이며, '속성'은 그 상자에 대한 추가 정보를 제공합니다.
이런 방식으로 모든 것이 잘 정리되어 있어, 필요한 정보를 쉽게 찾을 수 있습니다."

모든 XML 문서는 루트(root) 요소를 포함하며,
이 안에 여러 자식(child) 요소를 포함할 수 있습니다.
예를 들어, <book> 태그는 하나의 책을 나타내며,
<title>, <author>와 같은 여러 자식 요소를 포함할 수 있습니다.
XML 문서는 반드시 닫는 태그를 포함해야 하며, 대소문자를 구분합니다.
또한, XML 선언은 문서의 최상단에 위치하며, 버전과 인코딩 타입을 명시합니다.

<?xml version="1.0" encoding="UTF-8"?>
<book>
  <title>XML for Beginners</title>
  <author>John Doe</author>
</book>

 

XML 스키마와 DTD

XML 스키마와 DTD(문서 형식 정의)는 XML 문서의 구조를 정의하고,

해당 문서 내의 데이터 타입을 검증하는 데 사용됩니다.

"상상해 보세요, 당신이 건축가이고, 건물을 짓기 전에 설계도를 그립니다.

XML 스키마와 DTD는 마치 그 건물의 설계도와 같습니다.

이들은 XML 문서가 어떤 구조를 가져야 하는지, 어떤 정보를 담을 수 있는지 정확히 알려줍니다.

이런 규칙들 덕분에 모든 정보가 제자리에 있고, 오류 없이 잘 작동합니다."

DTD는 XML의 초기 버전에서 사용되었으며, 스키마는 더 강력한 데이터 타입 지원과 네임스페이스를 제공합니다.

이러한 도구를 사용함으로써, 데이터의 일관성과 정확성을 보장할 수 있습니다.

플랫폼 및 프로그래밍 언어와의 독립성

XML은 대부분의 플랫폼과 프로그래밍 언어에서 처리할 수 있는 독립적인 형식입니다.
이 독립성은 다양한 시스템 간에 데이터를 교환하는 데 있어 큰 이점을 제공합니다.

XML 활용

개발자들은 웹 서비스, 구성 파일, 데이터베이스 등에서 XML을 사용합니다.
이를 통해 데이터가 어떻게 보이고 작동해야 하는지 설명하고, 데이터 전송과 표현을 동시에 처리할 수 있습니다.
또한, XML은 많은 시스템과 애플리케이션에서 중요한 역할을 하는 핵심 기술입니다.

XML의 장점과 단점

 

장점

XML은 데이터의 자기 기술적(self-descriptive) 특성과 텍스트 기반 구조로 인해 인간과 기계 모두에게 읽기 쉽습니다.

또한, 플랫폼 독립적이며, 확장 가능하고, 사용자 정의 태그를 통해 유연한 데이터 표현이 가능합니다.

 

단점

그러나 XML은 종종 파일 크기가 크고, 파싱(parsing) 시간이 오래 걸릴 수 있는 단점이 있습니다.

이는 네트워크 대역폭과 처리 성능에 영향을 줄 수 있습니다.

 

최근에는 JSON(JavaScript Object Notation)과 같은 경량의 데이터 교환 형식이 인기를 얻고 있습니다.

JSON은 텍스트 기반의 구조로, 웹 애플리케이션에서의 데이터 교환에 최적화되어 있으며,

XML에 비해 더 작은 파일 크기와 빠른 파싱 속도를 제공합니다.

"XML과 JSON을 비교하자면, XML은 전통적인 편지와 같고, JSON은 이메일 같습니다.

JSON은 더 빠르고 간단한 메시지를 주고받는 데 적합하다면,

XML은 더 많은 정보와 세부 사항을 담을 수 있어서, 복잡한 데이터를 다룰 때 유용합니다."

그러나 XML은 메타데이터와 네임스페이스 지원이 뛰어나고, 보다 복잡한 문서 구조를 표현하는 데 유리합니다.

SBOM과 Cyclone DX, SPDX에 대해 궁금하신 분들은 아래 링크를 참조해주세요

SBOM

CycloneDX

SPDX


XML의 유연성과 확장성은 다양한 분야에서 그 가치를 발휘합니다.

예를 들어, 금융 서비스에서는 거래 데이터의 교환, 의료 분야에서는 환자 정보의 공유,

출판에서는 디지털 책의 포맷팅에 XML을 활용합니다.

이러한 사례들은 XML이 다양한 시스템과 애플리케이션에서 데이터를 표준화하고,

교환하는 데 어떻게 중요한 역할을 하는지 보여줍니다.

 

오늘은 XML이 무엇인지, 그 중요성과 장점 등에 대해 알아보았습니다. 

데이터 구조의 표현과 공유에서 XML의 유연성과 확장성이 중요한 이유임을 이해할 수 있을 것입니다. 

다음 시간에는 다른 흥미로운 주제로 돌아오겠습니다. 

그럼 즐거운 하루 보내세요!


궁금하신 사항은 댓글에 남겨주세요
댓글에 남겨주신 내용
추후 정리해서 올려드리겠습니다
구독 신청하시면 업로드 시 알려드릴게요!
-
조금이라도 도움이 되셨다면
공감&댓글 부탁드리겠습니다
감사합니다!

반응형
반응형

인캡슐레이션

오늘은 인캡슐레이션과 디캡슐레이션이 무엇인지 확인해 보는 시간을 가지도록 하겠습니다.

아주 쉽게 설명해드릴테니 아래 검색 결과를 읽다가 포기하지 말아 주세요!

인캡슐레이션과 디캡슐레이션을 인터넷에 검색해 보면 뭐라고 나오는지 한번 찾아볼까요?

 

인캡슐레이션
(Encapsulation)

 

인캡슐레이션은 상위 계층 -> 하위 계층으로 보내는 행위입니다.

네트워킹에서는 데이터 패킷이 전송 계층을 거치면서 헤더나 기타 정보가 추가되어 가는 과정이며,
데이터와 그 데이터를 처리하는 함수를 하나의 단위로 묶는 것을 의미합니다.

이는 주로 객체 지향 프로그래밍에서 볼 수 있는 개념으로,

데이터 구조와 데이터를 처리하는 방법들을 결합하여 데이터의 추상화,

정보 은닉 및 데이터 보호를 달성하는 기법입니다.

이렇게 해서 데이터는 다음 계층으로 넘어갈 준비가 됩니다.

 

계층이 무슨 말인지 잘 모르시겠다면

OSI 7 계층 레이어 글을 읽고 와주세요!

https://jdcyber.tistory.com/11

 

OSi 7계층 모델이란? (개념/이해/설명) TCP/IP Protocol suite

너무 말이 어렵게 느껴지더라도 조급해하지 마세요 그저 설명되어 있는 글을 읽고 아 그렇구나 하고 넘어가시면 됩니다. 하나하나 이해하려고 하면 할 수 없습니다. 시간이 지나며 차차 이해하

jdcyber.tistory.com


디캡슐레이션
(Decapsulation)

 

디캡슐레이션은 상위 계층 -> 하위 계층 즉 반대로 보내는 행위입니다.

마찬가지로 데이터를 전송하기 위해서 프로토콜 정보를 추가하는 패키지 과정이죠

디캡슐레이션은 인캡슐레이션의 반대 과정으로,

데이터 패킷에서 헤더나 추가된 정보를 제거하는 과정을 말합니다.

네트워킹에서는 패킷이 목적지로 전송되는 동안 각 계층에서 필요한 헤더나 정보가 제거되어 원래의 데이터만 남게 됩니다.

객체 지향 프로그래밍에서는 객체 내부의 데이터에 접근하거나 그 데이터를 조작하는 과정을 의미할 수 있습니다.

 

패킷과 헤더에 대해 궁금하시다면

아래 글을 읽어주세요!

https://jdcyber.tistory.com/12

 

패킷(Packet)이란? (쉬운 설명, 구조, 헤더, 인캡슐레이션, 핑, Ping)

패킷 (Packet) 이란 무엇일까요? 패킷은 패키지(package)와 덩어리를 뜻하는 버킷(bucket)의 합성어로 통신망을 통해 전송하기 쉽도록 데이터를 잘게 나눈 전송 단위입니다. 본래 패킷은 소포를 뜻하는

jdcyber.tistory.com


디캡슐레이션

뭐라고 하는 거예요?

 

네 쉽게 설명해 드리겠습니다.

인캡슐레이션 (Encapsulation)
상자에 물건을 넣고 그 위에 라벨을 붙이는 것과 비슷합니다.
프로그래밍에서는 데이터(물건)와 그 데이터를 다루는 기능(라벨)을 상자에 함께 넣는 것을 말해요.
이렇게 함으로써 데이터를 안전하게 보호하고, 필요할 때만 꺼내 쓸 수 있어요.
디캡슐레이션 (Decapsulation)
상자에서 물건을 꺼내는 것과 같습니다.
네트워킹에서는 데이터가 여행하는 동안 각 정거장에서 불필요한 라벨(정보)을 하나씩 제거해요.
결국 목적지에 도착했을 때, 원래의 데이터만 남게 되죠.

 

인캡슐레이션은 데이터를 캡슐화하여 보호하고,

디캡슐레이션은 그 캡슐을 제거하여 데이터에 접근하는 과정입니다.

 

여기서 우리는 프로토콜이라는 개념도 알아갈 필요가 있습니다.

프로토콜

프로토콜
(Protocol)

 

프로토콜은 데이터 전송 규약이라고도 불리는데요
네트워크 환경에서 데이터를 전송할 때 전송 방법을 정의하는 규칙입니다.
인캡슐레이션 디캡슐레이션 역시 데이터를 전송하는 방법이 기 때문에 프로토콜에 의해 만들어집니다.
용도에 따라 프로토콜도 종류가 많은데요

오늘은 프로토콜이 데이터 전송 규약이며 도구구나 정도만 알고 넘어가겠습니다.

조금 자세히 알고 싶으시면 위에 링크 남겨드린 OSI 7 레이어 글을 읽으시면 도움이 되실 거예요!

 


정리

인캡슐레이션은 네트워크 프로토콜 규칙에 따라 데이터를 캡슐화하는 과정이며,
디캡슐레이션은 도착지에서 그 캡슐을 제거해 원본 데이터를 복원하는 과정으로,
이 모든 것이 특정 프로토콜의 지침에 따라 이루어지며,
프로토콜은 컴퓨터나 네트워크 장비들이 서로 정보를 주고받을 때 지켜야 할 규칙이나 절차의 집합입니다.

궁금하신 사항은 댓글에 남겨주세요

댓글에 남겨주신 내용

추후 정리해서 올려드리겠습니다

구독 신청하시면 업로드 시 알려드릴게요!

-

조금이라도 도움이 되셨다면

공감&댓글 부탁드리겠습니다

감사합니다!

반응형
반응형
패킷 (Packet) 이란 무엇일까요?

 

 

패킷은 패키지(package)와

덩어리를 뜻하는 버킷(bucket)의 합성어

통신망을 통해 전송하기 쉽도록 데이터를 잘게 나눈 전송 단위입니다.

 

본래 패킷은 소포를 뜻하는 용어인데

우체국에서 화물을 적당한 덩어리로 나누어 행선지를 표시하여

꼬리표를 붙이는 작업을 데이터 통신에 접목한 용어로 사용하고 있습니다.

 

즉 패킷은 UDP TCP IP 등 모두가 가지고 있는

데이터 조각이라고 이해하시면 편하십니다.

 

Ping 아시나요?

ping google.com
142.251.42.174의 응답: 바이트=32 시간=62ms TTL=116
142.251.42.174의 응답: 바이트=32 시간=62ms TTL=116
142.251.42.174의 응답: 바이트=32 시간=62ms TTL=116
142.251.42.174의 응답: 바이트=32 시간=62ms TTL=116
142.251.42.174에 대한 Ping 통계:
    패킷: 보냄 = 4, 받음 = 4, 손실 = 0 (0% 손실),
왕복 시간 (밀리초):
    최소 = 61ms, 최대 = 65ms, 평균 = 62ms

 

이렇게 저희는 자신의 컴퓨터에서 간단하게 cmd 혹은 터미널을 통해

구글에 ping 요청을 보내서 네트워크가 잘 이어지고 있는지

패킷을 보내고 받음으로써 검증합니다.

이처럼 패킷은 네트워크 간 주고받는 "무언가"입니다.

네트워크에서 그만큼 패킷이라는 개념은 생각보다 매우 중요합니다.

인터넷에서 하는 모든 작업에는 패킷이 사용되기 때문이죠,

인터넷에선 사용자 간 데이터를 주고받을 때 데이터는 패킷으로 전달됩니다.

패킷의 구조

 

그렇다면 패킷은 어떻게 생겼을까요?

 

데이터 부분을 잘게 쪼개서 패킷으로 전송한다

 

네트워크 패킷은 헤더(Header), 페이로드(Payload), 트레일러(Trailer) 세 부분으로 구성됩니다.

 

헤더는

패킷 길이, 프로토콜, 보낸/받는 사람의 IP 주소 등이

포함되며 UDP TCP IP 등 모두가 가지고 있는

데이터의 머리, 즉 중요한 게 담겨있는

데이터의 가장 앞부분이라고이라고 이해하시면 편하십니다.

헤더에는 주로 데이터 형식에 대한 정보나 시간 데이터, 주소 데이터로 구성되어 있고

데이터의 종류에 따라 정리되기 쉽게 규격화해 놓은 데이터입니다.

 

오늘은 패킷이 이런 거구나 하고 대략적으로만

알고 넘어가 주시면 좋을 것 같습니다.

 

패킷의 내용은 데이터로 전송될 때

인캡슐레이션과 디캡슐레이션을 하여전송하게 되는데요

인캡슐 레이션과 디캡슐레이션에 대한 내용이 궁금하시다면

아래 링크를 통해 확인해 주세요

https://jdcyber.tistory.com/28

 

인캡슐레이션? 디캡슐레이션? 데이터 전송하기 (쉬운 설명, 개념, 정의)

오늘은 인캡슐레이션과 디캡슐레이션이 무엇인지 확인해 보는 시간을 가지도록 하겠습니다. 아주 쉽게 설명해드릴테니 아래 검색 결과를 읽다가 포기하지 말아 주세요! 인캡슐레이션과 디캡슐

jdcyber.tistory.com


오늘의 정리

IP가 들어간 데이터는 패킷이라고 부르고 이 패킷은 데이터를 잘게 나눠 소분한 것이다.

패킷의 헤더에는 IP 주소 등 중요한 정보가 담겨있다.

위 정보들을 데이터로 교환할 때는 인캡슐레이션 디캡슐레이션을 한다.


궁금하신 사항은 댓글에 남겨주세요

댓글에 남겨주신 내용

추후 정리해서 올려드리겠습니다

구독 신청하시면 업로드 시 알려드릴게요!

-

조금이라도 도움이 되셨다면

공감&댓글 부탁드리겠습니다

감사합니다!

반응형

+ Recent posts