'분류 전체보기' 카테고리의 글 목록 (29 Page)

[Network] 데이터를 전송하는 과정

2023.05.01

데이터를 전송하는 과정 데이터 전송은 일반적으로 송신자와 수신자 간에 이루어지며, 이를 위해 몇 가지 프로토콜과 기술이 사용됩니다. 예를 들어, 인터넷을 통해 이메일을 보내는 경우를 생각해보겠습니다. 1. 송신자(보내는 사람)는 이메일 프로그램을 사용하여 이메일을 작성합니다. 이메일 프로그램은 사용자가 작성한 내용을 메일 서버에 보내기 위해 Simple Mail Transfer Protocol (SMTP)이라는 프로토콜을 사용합니다. 2. SMTP는 메일 서버에 연결하여 데이터를 전송합니다. 이때 송신자의 이메일 주소와 수신자의 이메일 주소, 메일 내용 등이 포함됩니다. 3. 수신자(받는 사람)는 이메일 프로그램을 사용하여 자신의 메일 서버에 연결합니다. 이때 사용되는 프로토콜은 보통 Post Offic..

Operating System/Network

[Network] 맥 주소란?

2023.04.30

맥주소란? 맥 주소(MAC Address)는 네트워크 인터페이스 카드(Network Interface Card, NIC)가 가지는 고유 식별자입니다. 이 주소는 모든 이더넷(Ethernet) 네트워크에서 사용됩니다. 맥 주소는 48비트 길이의 16진수(Hexadecimal) 값으로 표현됩니다. 이 주소는 일반적으로 아래와 같은 형식으로 표시됩니다: 00:11:22:33:44:55. 각각의 16진수 값은 콜론(:)으로 구분됩니다. 맥 주소는 네트워크에서 데이터를 보내거나 받는 데 사용됩니다. 이 주소는 데이터가 전송되는 동안 패킷(Packet)의 헤더에 삽입되어 보내는 쪽과 받는 쪽을 구별합니다. 이를 통해 네트워크에서 각각의 장치가 고유하게 식별되며, 데이터 전송에 필요한 다양한 프로토콜에서 사용됩니다...

Data Engineering/Spark

[Spark] 스파크란 무엇인가?

2023.04.21

아파치 스파크란? 아파치 스파크(Apache Spark)는 대규모 데이터 처리를 위한 오픈소스 분산 컴퓨팅 프레임워크입니다. 스파크는 빅데이터 처리를 위한 하둡 생태계 내에서 많이 사용되며, 분산 컴퓨팅 클러스터에서 대규모 데이터 처리를 지원합니다. 스파크는 다양한 언어로 개발이 가능하며, 스칼라, 자바, 파이썬, R 등에서 사용될 수 있습니다. 스파크는 기본적으로 데이터 처리를 위한 API인 RDD(Resilient Distributed Datasets)와 데이터 처리 및 머신러닝을 위한 라이브러리들을 제공합니다. RDD는 분산된 불변 객체 컬렉션으로, 다양한 방식으로 생성이 가능합니다. RDD는 높은 가용성과 내구성을 가지며, 분산 컴퓨팅 클러스터에서 안정적으로 처리를 수행할 수 있습니다. 스파크는 ..

Database/SQL

[SQL] 효율적인 쿼리 작성 방법

2023.04.17

효율적인 쿼리 작성 방법 효율적인 쿼리 작성 방법에 대해서는 다음과 같은 것들이 있습니다. 인덱스를 활용하기 데이터베이스에 인덱스를 생성해 놓으면 데이터를 빠르게 찾을 수 있습니다. 인덱스를 생성할 때는 자주 사용하는 컬럼에 대해서 생성하는 것이 좋습니다. 하지만 인덱스를 너무 많이 생성하면 데이터 삽입, 수정, 삭제 시간이 길어질 수 있으므로 적절한 인덱스를 생성해야 합니다. 적절한 쿼리 작성하기 조건절에 적절한 컬럼을 사용하고, 중복되는 데이터를 최소화하는 등 적절한 쿼리 작성 방법이 중요합니다. 불필요한 연산을 피하고, 필요한 컬럼만 가져오는 것도 성능에 도움이 됩니다. 데이터 정규화 데이터를 정규화하여 중복 데이터를 제거하면 저장 공간을 절약할 수 있고, 데이터 무결성이 유지됩니다. 하지만 데이터..

Data Engineering/Kafka

[Kafka] 카프카의 장단점

2023.04.17

아파치 카프카의 장단점 아파치 카프카는 대용량 실시간 메시징 시스템으로, 대량의 데이터를 안정적이고 빠르게 전송하고 처리하는 데 사용됩니다. 이를 위해 아파치 카프카는 분산형 아키텍처를 채택하며, 여러 대의 브로커와 프로듀서, 컨슈머로 구성됩니다. 장점: 대용량 데이터의 분산 처리: 아파치 카프카는 대량의 데이터를 처리하기 위한 분산형 아키텍처를 채택하고 있어, 대용량 데이터를 안정적으로 처리할 수 있습니다. 실시간 처리: 아파치 카프카는 실시간 처리에 최적화되어 있어, 실시간으로 대용량 데이터를 처리할 수 있습니다. 고가용성: 아파치 카프카는 다수의 브로커로 구성되어 있어, 하나의 브로커가 다운되더라도 다른 브로커가 대신 처리할 수 있어, 고가용성을 보장합니다. 확장성: 아파치 카프카는 수평적으로 확장..

Operating System/Linux

[Linux] 자주 사용하는 리눅스 명령어

2023.04.17

리눅스는 명령어를 이용하여 파일 및 디렉토리를 관리하며, 시스템을 제어할 수 있습니다. 이번에는 자주 사용되는 리눅스 명령어 중 일부를 소개하겠습니다. ls : 디렉토리 내의 파일 목록을 출력합니다. ls -a : 숨겨진 파일도 함께 출력합니다. ls -l : 파일의 상세 정보를 함께 출력합니다. cd : 디렉토리를 이동합니다. cd .. : 상위 디렉토리로 이동합니다. cd / : 루트 디렉토리로 이동합니다. mkdir : 디렉토리를 생성합니다. mkdir -p : 하위 디렉토리를 한 번에 생성합니다. rm : 파일을 삭제합니다. rm -r : 디렉토리를 삭제합니다. cp : 파일을 복사합니다. cp -r : 디렉토리를 복사합니다. mv : 파일을 이동하거나 이름을 변경합니다. touch : 파일을 생..

Operating System/Linux

[Linux] 리눅스 구성요소

2023.04.17

리눅스란 리눅스는 현재 가장 인기있는 운영 체제 중 하나입니다. 리눅스는 무료이며 오픈 소스 소프트웨어입니다. 이 운영 체제는 많은 컴퓨터 및 모바일 기기에서 사용됩니다. 리눅스는 처음에 리누스 토발즈가 만들었습니다. 리누스는 1991년에 처음으로 리눅스를 발표했습니다. 리눅스는 UNIX 운영 체제를 기반으로하며 C언어로 작성됩니다. 리눅스는 Windows나 macOS와 같은 운영 체제와는 다르게, 오픈 소스 소프트웨어입니다. 이는 소스 코드가 누구나 자유롭게 수정하고 배포할 수 있다는 것을 의미합니다. 이러한 이유로, 많은 개발자들이 리눅스를 좋아하고 사용합니다. 리눅스는 다양한 용도로 사용됩니다. 개인용 컴퓨터에서부터 서버, 슈퍼컴퓨터, 스마트폰, IoT 장비 등 다양한 장치에서 사용됩니다. 또한, ..

Operating System/Network

[Network] 프로토콜이란?

2023.04.16

프로토콜 프로토콜은 네트워크 상에서 데이터 통신을 원활하게 하기 위한 규약이며, 데이터를 주고받는 방식이나 데이터의 형식 등을 정의합니다. 예를 들어, 인터넷에서 사용되는 TCP/IP 프로토콜은 데이터를 송수신하는 방법과 데이터의 형식을 정의하고 있습니다. 이러한 프로토콜은 서로 다른 시스템이나 기기 간에 데이터를 교환할 때 필요한 공통된 규약으로, 네트워크에서 데이터 통신이 원활하게 이루어지도록 돕습니다. 또한, 프로토콜은 계층적으로 구성되어 있으며, 각 계층마다 다른 기능을 수행합니다. 예를 들어, TCP/IP 프로토콜은 네트워크 상에서 데이터를 전송하는 전송 계층과 인터넷 상에서 데이터를 전달하는 인터넷 계층으로 구성되어 있습니다. 이와 같은 프로토콜은 네트워크 상에서 데이터 통신이 원활하게 이루어..

Programming Language/Python

[Python] sqlite3 이용하여 데이터 여러줄 한번에 입력하는 방법

2023.04.06

import sqlite3 con = sqlite3.connect(':memory:') cur = con.cursor() cur.execute("CREATE TABLE my_test_table(id int, name varchar, phone_number varchar);") data = [ (11, "Park", "010-1111-2222"), (12, "Kim", "010-1234-5678"), (13, "Oh", "010-8765-4321s"), ] cur.executemany("INSERT INTO my_test_table VALUES (?, ?, ?);", data) result = cur.execute("SELECT * FROM my_test_table;") for row in result: ..

Programming Language/Python

[Python] sqlite3 이용하여 데이터 입력 및 출력하는 방법

2023.04.06

import sqlite3 con = sqlite3.connect(":memory:") cur = con.cursor() cur.execute("CREATE TABLE my_test_table (id int, name varchar, phone_number varchar);") cur.execute("INSERT INTO my_test_table VALUES (1, 'Park', '010-0000-0000');") cur.execute("INSERT INTO my_test_table VALUES (2, 'Kim', '010-1234-5678');") result = cur.execute("SELECT * FROM my_test_table;") for row in result: print(row) cur...

데이터 엔지니어

[Network] 데이터를 전송하는 과정

[Network] 맥 주소란?

[Spark] 스파크란 무엇인가?

[SQL] 효율적인 쿼리 작성 방법

[Kafka] 카프카의 장단점

[Linux] 자주 사용하는 리눅스 명령어

[Linux] 리눅스 구성요소

[Network] 프로토콜이란?

[Python] sqlite3 이용하여 데이터 여러줄 한번에 입력하는 방법

[Python] sqlite3 이용하여 데이터 입력 및 출력하는 방법

티스토리툴바