
뉴럴 네트워크란 무엇인가?
뉴럴 네트워크(Neural Network)는 인간의 뇌 구조에서 아이디어를 얻은 인공지능 모델입니다.
쉽게 말해,
인간의 뇌가 수많은 뉴런(신경 세포)들이 서로 연결되어 정보를 처리하듯이,
컴퓨터도 비슷한 구조로 데이터를 처리할 수 있도록 설계한 것이죠.
🧠 사람의 뇌 vs 인공 신경망
- 사람 뇌: 뉴런(신경 세포)들이 전기 신호를 주고받으며 사고, 판단, 기억을 합니다.
- 인공 신경망: 가상의 뉴런(노드)들이 수학적인 연산을 통해 입력 데이터를 처리하고, 결과를 만들어냅니다.
뉴럴 네트워크의 기본 구성 요소
1. 입력층 (Input Layer)
외부에서 들어온 데이터를 처음 받아들이는 층입니다.
예를 들어, 이미지라면 픽셀 정보가 이 층으로 들어오고, 음성이라면 음파의 수치값이 입력됩니다.
2. 은닉층 (Hidden Layer)
가장 중요한 계산이 이뤄지는 층입니다.
- ‘은닉층’이라는 이름은 눈에 보이지 않지만 내부에서 중요한 처리를 담당한다는 의미입니다.
- 이 안에서 수많은 ‘뉴런’들이 입력값에 가중치를 곱하고, 편향을 더한 후 활성화 함수를 통과시켜 다음 층으로 전달합니다.
3. 출력층 (Output Layer)
최종 결과가 나오는 층입니다.
- 예를 들어, 고양이 vs 강아지 이미지를 분류한다면
→ 출력층은 “고양이일 확률: 80%, 강아지일 확률: 20%”처럼 결과를 내보냅니다.
💡 예시 입력값 “고양이 사진”이라는 이미지가 입력되었다고 가정했을때, 이 이미지는 수많은 픽셀(예: [0.6, 0.2, 0.9])의 조합으로 표현되고, 이 숫자들이 입력값입니다. 가중치
편향 위 계산 결과가 0.77인데, 편향이 0.2라면? → 0.77 + 0.2 = 0.97 활성화 함수
|
뉴런(Neuron)은 무엇을 하나요?
각 뉴런은 다음과 같은 과정을 수행합니다:
- 입력값을 받아
- 각 입력에 가중치(weight)를 곱하고
- 편향(bias)을 더한 뒤
- 활성화 함수(activation function)를 거쳐
- 그 결과를 다음 뉴런으로 전달합니다.
💡 예를 들어 뉴런 하나에 [0.5, 0.8]이 들어오고, 가중치가 [1.2, 0.3], 편향이 0.1이라면:
- 계산: (0.5×1.2) + (0.8×0.3) + 0.1 = 약 0.98
- 여기에 ReLU 같은 활성화 함수 적용 → 다음 층으로 결과 전달
이러한 계산이 수천 개의 뉴런, 수백 개의 레이어에서 동시에 일어난다고 상상해보세요!
💡 전체 정리 (한 줄로 다시)
입력값에 각 가중치를 곱하고, 편향을 더해,
활성화 함수를 통과시킨 후 그 결과를 다음 뉴런에 전달하는 것 —
이게 바로 뉴럴 네트워크에서 한 뉴런이 하는 일입니다.
이 단순한 과정을 수천, 수만 개의 뉴런이 동시에 처리하니까 어마어마한 연산량이 필요하고,
그래서 우리가 NPU 같은 연산 가속기를 쓰게 되는 것이죠
뉴럴 네트워크는 어떻게 학습할까요?
초기에는 랜덤한 가중치를 사용하지만, 학습을 반복하면서 정답과의 오차를 줄이기 위해 가중치를 조금씩 수정해나갑니다.
이 과정을 역전파(Backpropagation)라고 부릅니다.
- 순전파(Forward): 입력 → 예측값 도출
- 오차 계산: 예측값 vs 실제값 차이
- 역전파(Backward): 오차를 따라 가중치를 업데이트
- 반복 학습: 예측이 점점 더 정확해짐
이걸 수백 번, 수천 번 반복하면 모델이 점점 ‘똑똑해진다’고 볼 수 있는 것이죠.
https://jdcyber.tistory.com/98
NPU를 위한 AI 기초 딥러닝의 핵심, 활성화 함수 완전 정복 (ReLU, Sigmoid, Tanh 차이와 선택 기준)
딥러닝을 공부하다 보면 반드시 마주치는 개념 중 하나가 바로 "활성화 함수(Activation Function)"입니다.입력값에 가중치를 곱하고, 편향을 더한 후, 그냥 바로 다음 층으로 전달하면 되는 것 아닌가
jdcyber.tistory.com
뉴럴 네트워크의 강점
- 데이터를 넣으면 자동으로 특징을 뽑아내고,
- 복잡한 패턴을 스스로 학습할 수 있으며,
- 음성, 이미지, 텍스트 등 다양한 형태의 데이터를 처리할 수 있습니다.
예를 들어, 이전에는 사람이 “고양이는 귀가 뾰족하고 눈이 크다”는 규칙을 일일이 만들어줘야 했다면, 이제는 데이터를 충분히 보여주기만 해도 뉴럴 네트워크가 스스로 그런 특징을 찾아냅니다.
마무리 정리
뉴럴 네트워크란?
뉴럴 네트워크란? 인간의 뇌를 흉내 낸 인공지능 모델 뉴런들이 입력값을 계산해서 다음 층으로 전달하고, 학습을 반복하며 점점 더 정확한 판단을 하게 되는 구조입니다. |
이러한 신경망 구조가 바로 딥러닝(Deep Learning)의 핵심이며,
오늘날 음성 인식, 이미지 분류, 자율주행, 챗봇까지 수많은 AI 기술의 기반이 됩니다.
https://jdcyber.tistory.com/93
NPU를 위한 AI 기초 (1-1): 인공지능<Ai>, 머신러닝<ML>, 딥러닝<DL>의 관계 완전 정복
NPU 정복을 위한 로드맵 이후 두번째 글입니다.https://jdcyber.tistory.com/92 NPU에 흥미를 느낀 30대 비전공자의 공부 로드맵“NPU(Neural Processing Unit)를 공부하고 이해하고자 비전공자의 NPU 무작정 파헤
jdcyber.tistory.com
궁금하신 사항은 댓글에 남겨주세요
댓글에 남겨주신 내용은
추후 정리해서 올려드리겠습니다
구독하시면 업로드 시 알려드릴게요!
-
조금이라도 도움이 되셨다면
공감&댓글 부탁드리겠습니다
감사합니다!
'NPU' 카테고리의 다른 글
딥러닝은 어떻게 학습할까? 순전파부터 NPU까지 한눈에 정리 (0) | 2025.04.09 |
---|---|
딥러닝 손실 함수 (MSE와 Cross-Entropy) 차이 (0) | 2025.04.09 |
딥러닝의 핵심, 활성화 함수 (ReLU, Sigmoid, Tanh 차이와 선택 기준) (0) | 2025.04.09 |
인공지능, 머신러닝(ML), 딥러닝(DL)의 관계 (1) | 2025.04.04 |
NPU에 흥미를 느낀 30대 비전공자의 공부 로드맵 (2) | 2025.04.04 |