GQ-Engine v1.5.0 · Kiwi + KoSentenceBERT · 2026.06

사유를 측량한다는
것에 대하여

TECHTONIC은 한국어 텍스트가 독자에게 유발하는 인지적 특성을 분석하는 화이트박스 하이브리드 엔진 GQ-Engine을 만듭니다. 규칙 기반 코어와 KoSentenceBERT 발화 이해 레이어, 4단계 파이프라인이 사유노드 스코어를 즉시 도출합니다 — 상용 생성형 LLM 편향 없이, 모든 판정을 역추적할 수 있게.

orgTECHTONIC
product글가게
engineGQ-Engine v1.5.0
accuracy81.0% (17/21)
GQ-Engine
글가게 · guel.shop

당신의 사유 방식을
아는 플랫폼

GQ-Engine이 텍스트를 분석하고, 당신이 어떻게 생각하는지를 돌려줍니다. 도파민 없는 깊이 있는 읽기. 사유는 측량될 수 있습니다.

platform글가게
engineGQ-Engine v1.5.0
urlguel.shop
statusbeta
Node Analysis Output ANALYZING_
Narrātio서사적 자아
Analogia은유적 추론
Refractio논리적 굴절
Fluentia심미적 유창성
Fundāmentum도덕적 기반
Provocātio실존적 도발
Speculātio자아 투사
Reversio기질적 배반
Ignītio억압적 점화
Synthesio의미론적 통합
§ 01 · Thesis

별점은 거짓말할 수 있지만, 시선은 거짓말하지 않는다 #

현재 시장을 지배하는 모든 콘텐츠 플랫폼은 동일한 전제 위에 서 있습니다 — 유저가 누른 '좋아요', 머문 체류 시간, 완료한 시청이 진정한 선호를 반영한다는 전제. 이 전제는 틀렸습니다. 이성적 자아는 철학 에세이에 별점 5점을 부여하지만, 본능적 자아는 3초 만에 스크롤을 내립니다.

이 두 자아 사이의 괴리 — 두 자아 괴리율 Δui — 야말로 인간의 진짜 사유 성향이 숨어있는 장소입니다. GQ-Engine은 이 괴리를 수학적으로 측량하여, 화이트박스 파이프라인으로 한국어 텍스트의 사유 밀도를 사유노드로 분해합니다 — 상용 생성형 LLM 편향 없이.

📐 The Equation
엔진의 출발점은 명시적 선호 Sui와 현시적 선호 Rui의 괴리를 텍스트 파라미터로 가중한 4차원 평가 벡터 J(u) = ⟨S̄u, R̄u, IV̄u, GP̄u⟩를 도출하는 것입니다.
§ 02 · Whitepaper

7편의 연구 보고서가 하나의 주장으로 #

글가게의 사유 공학 (WP-2026-01)7편의 연구 보고서(Foundation 3 · Theory 4)와 기술 설계 명세·비즈니스 논평·시장 분석을 함께 묶어, Foundation · Theory · Engineering · Business · Market 5개 파트로 구성됩니다. 사유는 측량될 수 있다 — 그리고 측량된 사유는 돌려줄 수 있다.

§ 03 · Engine

GQ-Engine 아키텍처 #

GQ-Engine은 화이트박스 하이브리드입니다. 규칙 기반 코어가 상용 생성형 LLM 편향을 배제하고, KoSentenceBERT 레이어가 문장 단위 발화 이해를 더합니다. 피처는 Kiwi 품사 태깅으로 추출되어 문장이 속한 발화 유형에 따라 재가중되고, 사유노드별로 채점된 뒤, 통계 기반 후처리(Layer 4)로 재랭킹됩니다. 모든 판정은 피처까지 역추적할 수 있습니다. 로컬 Gemma는 백그라운드에서 독립 감사를 수행할 뿐 — 절대 응답 경로에 올라타지 않습니다.

G·LAB · 측정 전제 조건

리커트 척도(별점)로 선호를 직접 물으면 SDB(사회적 바람직성 편향)가 발생합니다. 응답자는 자신이 지적이고 도덕적으로 보이도록 답을 왜곡하기 때문에, 수집된 Sui 자체가 오염됩니다.

G·LAB은 마이크로 픽션 기반 SJT(상황 판단 검사) 방법론으로 이 편향을 우회합니다. 유저는 짧은 이야기 속 인물의 선택지를 고르는 방식으로 반응하기 때문에, 자신이 측정당한다는 사실을 인식하지 못합니다.

⚠ 측정 전제 조건
별점이 오염되면 Δui도 오염된다. G·LAB이 Sui의 신뢰도를 확보하는 것이 전체 괴리율 측정 체계의 논리적 전제 조건입니다.

Two-Self Gap · 두 자아 괴리율

명시적 선호 Sui는 평점을 정규화한 값, 현시적 선호 Rui는 체류 시간·정독 속도·역행 스크롤의 가중합을 CDF로 사상한 값입니다.

EQUATIONEq. 1 · TECH-2026-01

괴리값 Δui는 양수일 때 사유적 허영(Intellectual Vanity)이, 음수일 때 억눌린 본능(Guilty Pleasure)이 발현됩니다.

EQUATIONEq. 5–6 · TECH-2026-01

Text Parameters · 텍스트 파라미터

Cd
Cdiff · 인지 부하량
종속절 깊이, 추상 명사 밀도, 관용 표현 빈도로 산출한 텍스트의 객관적 난이도. [0, 1] 연속값. 신경과학적으로는 ACC(전대상피질) 활성화 확률을 예측하는 KRIT 모델의 표층 피처 집합과 대응됩니다.
Cp
Cprov · 감정 마찰계수
러셀 2차원 감정 모델의 각성도. 사회적 금기·원초적 욕망·인지적 불협화음의 자극 강도. MFT(도덕 기반 이론)의 배려·공정·순수 차원에서 촉발되는 Neural Prediction Error 기전과 직접 대응합니다.
→A
사유 벡터
텍스트가 타겟팅하는 4대 사유 축(I/E · A/N · P/D · S/F) 상의 기하학적 좌표.

Antagonistic Fit · 대척점 배제 계수

유저의 거부 기질 가중치 벡터와 콘텐츠 노드 확률의 내적값이 임계값을 돌파할 경우, 해당 콘텐츠를 추천 풀에서 영구 제거합니다. 단순 필터가 아니라 신경학적 혐오 반응 기전을 모델링한 배제 알고리즘입니다.

EQUATIONEq. 6 · FOUND-2026-03

분석 파이프라인 · 5단계

문장은 고립된 채 채점되지 않습니다. GQ-Engine은 각 문장의 발화 유형을 먼저 읽고, 그 맥락이 피처 해석 방식을 다시 빚게 한 뒤에야 노드 점수를 계산합니다.

01
피처 추출 · Kiwi 품사
Kiwi 형태소 태그(NP 대명사, EC·ETM 연결/관형 어미, EF 종결어미, VX·MAG 부정, NNG 명사)로 30여 개 원시 피처를 추출합니다. 직유는 표면 키워드가 아니라 JX 조사 태그로 판별하며, 하드코딩 상수는 v1.5.0에서 제거됐습니다.
02
발화 유형 분류 · BERT
KoSentenceBERT 모델(ko-sroberta-multitask)이 각 문장을 임베딩해 노드별 앵커 문장과 비교, 10종 발화 유형(고백·역전·질문·단정·도발·묘사·은유·논증·회상·서술) 중 하나를 부여합니다.
03
발화 조건부 현저성 보정
판별된 발화 유형이 관련 피처의 해석 가중치에 1.05–1.20배를 적용합니다 — 노드 점수는 직접 건드리지 않습니다. 은유형 문장은 metaphor_pattern_norm을, 고백형 문장은 suppression_lexeme_ratio를 키웁니다.
04
노드 스코어링 · 정규화
문장별 선형 결합으로 채점한 뒤 문장 수로 정규화하며, 단문 보정(≤2문장 시 1.35–1.5배)을 적용합니다. 활성 노드는 9개이고 Synthesio는 4개 기본 노드의 조화평균으로 산출됩니다. node_marker 부스트는 +0.10 상한.
05
Layer 4 · 통계 재랭킹
3단계 후처리가 형식 노드를 배경으로 밀고 내용 노드를 전면에 세웁니다 — 단, 1·2위 점수 차가 0.15 이상이면(dominant) 원본 순위를 유지합니다. 아래 참조.
⚙️ 비동기 감사
로컬 Gemma 모델이 백그라운드에서 동일 텍스트를 독립적으로 재분류해 일치/불일치를 PostgreSQL에 기록합니다(JSONB, asyncpg 풀). 응답 경로에는 절대 올라타지 않으므로, Gemma가 꺼져 있어도 엔진 응답에는 영향이 없습니다. Human-in-the-loop 검토는 Open WebUI로 수행합니다.
main.py · GQ-Engine Corepython
# 서버 시작 시 taxonomy · patterns 1회 로드 @asynccontextmanager async def lifespan(app): global TAXONOMY, PATTERNS, db_pool TAXONOMY = json.loads(TAXONOMY_FILE.read_text(encoding="utf-8")) PATTERNS = json.loads(PATTERNS_FILE.read_text(encoding="utf-8")) db_pool = await asyncpg.create_pool(DATABASE_URL, min_size=2, max_size=10) yield # 발행 즉시 태그 도출 → Gemma 감사는 백그라운드로 @app.post("/analyze") async def analyze(request: AnalysisRequest, bg: BackgroundTasks): result = analyze_core(request.text) # 즉시 반환 bg.add_task(ask_gemma_and_save_feedback, ...) # 백그라운드 return result
⚙️ Engineering Note
taxonomy와 patterns는 서버 시작 시 1회 로드되고, /analyze는 발행 즉시 동기적으로 태그를 반환합니다 — 분석 지연 0. Gemma 감사는 BackgroundTasks로 완전히 분리돼 있어, 사용자 체감 지연은 오직 규칙 기반 코어에만 달려 있습니다.

Layer 4 · 형식 ↔ 내용 노드 재랭킹

잘 쓰인 글은 두 형식 노드(심미적 유창성·논리적 굴절)에서 항상 높게 나옵니다 — 그래서 글이 실제로 무엇에 관한지 드러내는 내용 노드를 잠식합니다. 자동 채점의 후광 효과입니다. Layer 4는 보고서 TECH-2026-04의 노드 간 공변구조·이중요인 분석에 근거한 3단계 판정으로 이를 교정합니다.

뭉치(cluster)
형식 노드의 순위로 결정. 심미적 유창성이 상위 3위 이내 → lyrical, 논리적 굴절이 상위 3위 이내 → argumentative, 둘 다 아니면 → low_quality.
불편함(discomfort)
불편함을 주는 내용 노드(기질적 배반·실존적 도발·억압적 점화·자아 투사) 중 하나가 전체 상위 3위 이내인가? → true / false.
개인적(personal)
자기를 향하는 노드(억압적 점화·자아 투사)가 내용 노드 상위 3위 이내인가? → true / false. 서사적 자아는 모든 개인적 텍스트를 잠식하므로 여기서 의도적으로 제외합니다.
🧭 8개 sub-cluster · dominant 가드
cluster(2) × discomfort(2) × personal(2) = 8개 sub-cluster, 각각 다른 내용 노드를 대/중/소 분류로 승격시킵니다. 1·2위 점수 차가 0.15 이상이면(trigger: dominant) Layer 4를 아예 건너뜁니다 — 명확한 승자는 결코 뒤집지 않습니다.

통계 검증 체계

대표 골든셋 정확도(81.0%, 17/21)는 하나의 체크포인트일 뿐 전부가 아닙니다. 노드 체계는 말뭉치가 커져도 타당성을 유지하도록 상시 심리측정 검사를 받습니다.

PSI
분포 안정성 지수
말뭉치 릴리스 간 피처 분포 드리프트를 모니터링해 재캘리브레이션 시점을 알립니다.
α
내적 일관성
Cronbach's α와 보완 지표로 각 노드 내부 피처들이 하나의 일관된 구성개념을 측정하는지 확인합니다.
G
일반화가능도 + 인간 평정
일반화가능도 이론과 인간 평정 기반 외적 타당화로, 내부 정답지가 아니라 전문가 판단에 비추어 엔진 판정을 검증합니다.
§ 04 · Cognition

10 Lēctio Nodes · 사유 노드 체계 #

FOUND-2026-02에서 정의된 10개의 Lēctio 노드는 텍스트가 독자의 신경 인지 회로를 어떻게 자극하는지를 분해한 축입니다. 각 노드는 4대 LECT 축에 대해 [−1.0, +1.0] 구간의 가중치를 가집니다. 엔진에서는 9개 노드가 직접 채점되며(형식 2 + 내용 7), 10번째인 Synthesio는 4개 기본 노드의 조화평균으로 산출되는 — 독립 측정값이 아니라 복합 통합 지표입니다.

N · 01
Narrātio
서사 속으로 침잠하는 사유
I/E +0.70A/N −0.80P/D −0.60S/F −0.90
DMN 기반 내면 시뮬레이션, 유동적 몰입
N · 02
Analogia
보이지 않는 연결을 감지하는 사유
I/E +0.50A/N −0.90P/D −0.50S/F −0.80
우반구 거친 의미 부호화, 원거리 의미망 활성화
N · 03
Refractio
저항 앞에서 멈추는 사유
I/E +0.40A/N +0.90P/D +0.80S/F +0.70
전대상피질(dACC) 활성화, 예측 오차 충돌
N · 04
Fluentia
문장의 결에 먼저 반응하는 사유
I/E −0.80A/N −0.70P/D −0.50S/F −0.80
처리 유창성(Processing fluency), 심미적 즉각 반응
N · 05
Fundāmentum
옳고 그름을 끝까지 묻는 사유
I/E +0.50A/N +1.00P/D +1.00S/F +0.90
DMN+CEN 협력, 마커 패싱 알고리즘
N · 06
Provocātio
근본이 흔들리는 문장에 끌리는 사유
I/E −0.70A/N −0.40P/D −1.00S/F −0.60
예측 오차를 쾌락으로 수용, 현저성 네트워크
N · 07
Speculātio
텍스트에서 자신을 발견하는 사유
I/E +1.00A/N −0.50P/D +0.60S/F −0.30
자기 참조 인지, mPFC + PCC
N · 08
Reversio
예상이 깨지는 순간 각성하는 사유
I/E −0.60A/N +0.70P/D −0.80S/F +0.50
Global oddball, 네트워크 스위칭
N · 09
Ignītio
읽은 뒤에도 떠나지 않는 문장
I/E +0.80A/N −0.30P/D +0.50S/F +0.60
기억 응고화, DMN 지속 반추
N · 10
Synthesio
모든 것이 맞아떨어지는 카타르시스
I/E +0.50A/N −0.60P/D +0.80S/F +1.00
VTA-NAcc 도파민 보상 회로, aSTG 감마파 · 복합 통합 지표

Normalization Formula · 4축 페르소나 정규화

10개 노드 원시 점수 벡터 N ∈ ℝ¹⁰와 축 가중치 벡터 W ∈ ℝ¹⁰로부터 최종 4축 성향 점수를 산출합니다. 부호에 따라 16가지 LECT 코드 중 하나가 부여됩니다.

EQUATIONFOUND-2026-02 · §04

Santiago Protocol · 10일 적응형 검증

1일차 삼지선다형 30문항으로 캘리브레이션하고, 2~9일차에 하루 20문장씩 총 160문항(별점 + I/O 채점)을 MIRT 기반 베이즈 사후 추정으로 갱신하며, 10일차에 결과를 확인합니다. 총 190문항.

Day 1
Baseline Calibration
삼지선다형 30문항. 중립 문항으로 유저의 θu 초기 분포를 추정합니다.
Day 2–5
Perturbation & Conflict
20문장 × 4일, 별점 + I/O 채점. SDB 자극형 + 극단적 호불호 문항으로 IVui · GPui 추출 및 괴리율 Δui 분산 극대화.
Day 6–8
Adaptive Branching
20문장 × 3일. 16개 페르소나 중 2~3개 후보군으로 압축. D-optimality 기반 최대 정보량 문항 동적 선별.
Day 9
Cascading Validation
20문장. SPRT 기반 최종 판정, MIRT MLE 완료.
Day 10
결과 확인
사유 여권 발급. 16가지 LECT 코드 중 하나가 부여되고, 개인화 추천 파이프라인이 가동됩니다.
§ 05 · Business

Moat · 독보적 비즈니스 해자 #

🛡 Unfakeable Data
유저가 의도적으로 취향을 포장하려 해도, 체류 밀도 기반 수식을 속일 수 없습니다. 별점은 거짓말할 수 있지만 시선은 거짓말하지 않습니다.
🎯 Hyper-Personalization
표면적 장르가 아닌 사유 방식(예: "지적 허영이 높고 논리적 반전을 즐기는 타입")으로 매칭하여 타겟팅 효율을 극대화합니다.
🔒 High Switching Cost
10일간의 산티아고 프로토콜을 거쳐 자신의 진정한 내면을 이해해 주는 플랫폼을 만난 유저는 단순 도파민으로 돌아가지 못합니다.

Market · 글로벌 멘탈 웰니스 교차점

GQ-Engine의 시장은 전자책·웹소설이 아닌 글로벌 멘탈 웰니스 × 프리미엄 지식 구독의 교차점입니다.

0B USD
TAM · 글로벌 멘탈 웰니스
2025 · Emergen Research
0억원
SAM · 아시아 프리미엄
딥 리딩 수요층
0억원
SOM · 초기 3년
점유 가능 시장
0%
20대 종합독서율
2025 국민독서실태조사
⚠ 시장 재정의
한국 성인 종합독서율은 2013년 72.2%에서 2025년 38.5%로 추락했지만, 20대는 75.3%, 전자책 독서율은 59.4%로 종이책을 추월. 글가게는 줄어드는 대중 독서 시장이 아니라, 디지털 피로에 반발해 텍스트로 회귀하는 2030 모바일 네이티브 시장을 정확히 겨냥합니다.
§ 06 · Company

TECHTONIC #

TECHTONIC은 서울 기반의 작은 연구팀입니다. 인지심리학·신경과학·심리측정학·NLP·시스템 엔지니어링이 만나는 좁은 교차점에서, 한국어 텍스트가 사유를 측량하는 도구가 될 수 있는지를 묻습니다.

📍 At a glance
TECHTONIC · Seoul, KR
Pre-seed · GQ-Engine v1.5.0 (Kiwi + KoSentenceBERT)
Product guel.shop ↗ · Engine GQ-Engine (화이트박스 하이브리드 + Gemma auditor)

글가게

글가게

텍스트 기반 독서 구독 플랫폼. 클래식 음악, 회화, 문학의 도슨트 콘텐츠를 깊이 있는 앱 환경에서 만나보세요. GQ-Engine이 모든 콘텐츠의 인지 태그를 자동으로 도출합니다.

Contact

© 2026 TECHTONIC · WP-2026-01 · REV. 2026.06
Infrastructure GitHub Open WebUI Ollama Gemma