SEO 감사(Audit) 실무 가이드

검색엔진 최적화(SEO) 감사란 웹사이트의 유기적 검색 성과에 영향을 미치는 기술적, 콘텐츠적 문제를 체계적으로 진단하고 개선 방안을 도출하는 과정이다. 이 문서는 SEO 감사의 전체 프레임워크를 다루며, 크롤링과 색인부터 콘텐츠 품질 평가, 사이트 유형별 점검 포인트, 그리고 AI 시대에 맞춘 콘텐츠 최적화 전략까지 포괄한다.

감사 전 사전 파악 사항

SEO 감사를 시작하기 전에 사이트의 맥락을 먼저 이해해야 한다. 어떤 유형의 사이트인지(SaaS, 이커머스, 블로그 등), SEO를 통해 달성하고자 하는 핵심 비즈니스 목표가 무엇인지, 우선순위 키워드나 주제 영역이 무엇인지를 파악하는 것이 출발점이다.

현재 상태도 함께 확인해야 한다. 이미 알려진 이슈나 우려 사항이 있는지, 현재 유기적 트래픽 수준은 어느 정도인지, 최근에 사이트 이전이나 대규모 변경이 있었는지를 점검한다. 감사 범위도 사전에 정해야 하는데, 전체 사이트를 대상으로 할 것인지 특정 페이지만 볼 것인지, 기술 SEO와 온페이지 SEO를 모두 다룰 것인지 한 영역에 집중할 것인지, Search Console이나 애널리틱스 접근 권한이 있는지를 미리 확인한다.

감사 프레임워크의 우선순위

SEO 감사는 다음 순서로 진행하는 것이 효과적이다. 첫째, 크롤링 가능성과 색인(Crawlability & Indexation)이다. 구글이 사이트를 찾고 색인할 수 있는지가 가장 기본이다. 둘째, 기술적 기반(Technical Foundations)으로 사이트가 빠르고 정상적으로 작동하는지 확인한다. 셋째, 온페이지 최적화(On-Page Optimization)로 콘텐츠가 적절히 최적화되어 있는지 본다. 넷째, 콘텐츠 품질(Content Quality)로 해당 콘텐츠가 검색 순위에 오를 자격이 있는지 평가한다. 다섯째, 권위와 링크(Authority & Links)로 사이트의 신뢰도를 검증한다.

기술 SEO 감사

크롤링 가능성

크롤링 가능성 점검의 첫 번째 대상은 robots.txt 파일이다. 의도하지 않은 차단이 없는지, 중요한 페이지가 허용되어 있는지, 사이트맵 참조가 올바르게 설정되어 있는지 확인해야 한다.

XML 사이트맵도 중요한 점검 항목이다. 사이트맵이 존재하고 접근 가능한지, Search Console에 제출되어 있는지, 정규화된(canonical) 색인 가능 URL만 포함하고 있는지, 정기적으로 업데이트되는지, 형식이 올바른지를 확인한다.

사이트 구조 측면에서는 중요한 페이지가 홈페이지에서 3번의 클릭 이내에 도달 가능해야 하며, 논리적인 계층 구조를 갖추고 있어야 한다. 내부 링크 구조가 체계적이어야 하고, 어디에서도 링크되지 않는 고아 페이지(orphan page)가 없어야 한다.

대규모 사이트에서는 크롤 예산(crawl budget) 문제도 고려해야 한다. 파라미터가 포함된 URL이 적절히 관리되고 있는지, 패싯 내비게이션(faceted navigation)이 올바르게 처리되는지, 무한 스크롤에 페이지네이션 폴백이 있는지, 세션 ID가 URL에 포함되지 않는지를 점검한다.

색인 상태

색인 상태를 확인하려면 site:domain.com 검색으로 색인된 페이지를 확인하고, Search Console의 커버리지 보고서를 검토하며, 실제 색인된 수와 예상 수를 비교한다.

색인 관련 흔한 문제로는 중요한 페이지에 noindex 태그가 잘못 설정된 경우, 캐노니컬 태그가 엉뚱한 방향을 가리키는 경우, 리다이렉트 체인이나 루프, 소프트 404, 캐노니컬 없이 중복 콘텐츠가 존재하는 경우가 있다.

캐노니컬 설정(canonicalization)에서는 모든 페이지에 캐노니컬 태그가 있어야 하고, 고유 페이지에는 자기 참조 캐노니컬이 설정되어야 한다. HTTP에서 HTTPS로의 캐노니컬, www와 non-www의 일관성, 후행 슬래시(trailing slash) 일관성도 확인해야 한다.

사이트 속도와 코어 웹 바이탈(Core Web Vitals)

코어 웹 바이탈은 세 가지 핵심 지표로 구성된다. LCP(Largest Contentful Paint)는 2.5초 미만이어야 하고, INP(Interaction to Next Paint)는 200밀리초 미만이어야 하며, CLS(Cumulative Layout Shift)는 0.1 미만이어야 한다.

속도에 영향을 미치는 요소는 다양하다. 서버 응답 시간(TTFB), 이미지 최적화, 자바스크립트 실행 시간, CSS 전달 방식, 캐싱 헤더, CDN 사용 여부, 폰트 로딩 방식이 모두 점검 대상이다. 이를 측정하는 도구로는 PageSpeed Insights, WebPageTest, Chrome DevTools, Search Console의 코어 웹 바이탈 보고서가 있다.

모바일 친화성

모바일 친화성은 현대 SEO의 필수 요소다. 별도의 모바일 사이트(m.site)가 아닌 반응형 디자인을 사용해야 하며, 탭 타겟 크기가 적절해야 하고, 뷰포트가 설정되어 있어야 한다. 가로 스크롤이 발생하지 않아야 하며, 데스크톱과 동일한 콘텐츠를 제공해야 하고, 모바일 우선 색인(mobile-first indexing)에 대비되어 있어야 한다.

보안과 HTTPS

사이트 전체가 HTTPS로 서비스되어야 하며, SSL 인증서가 유효해야 한다. 혼합 콘텐츠(mixed content)가 없어야 하고, HTTP에서 HTTPS로 리다이렉트가 설정되어야 한다. HSTS 헤더 적용은 추가적인 보안 강화 요소다.

URL 구조

URL은 읽기 쉽고 설명적이어야 한다. 자연스러운 곳에 키워드를 포함하되, 일관된 구조를 유지해야 한다. 불필요한 파라미터를 배제하고, 소문자와 하이픈 구분자를 사용하는 것이 권장된다.

온페이지 SEO 감사

타이틀 태그

타이틀 태그는 각 페이지마다 고유해야 하며, 주요 키워드를 앞쪽에 배치하는 것이 좋다. SERP에서 보이는 범위인 50~60자 이내로 작성하되, 클릭을 유도할 만큼 매력적이어야 한다. 브랜드명은 보통 끝에 배치한다.

타이틀 태그에서 자주 발견되는 문제는 중복 타이틀, 너무 길어서 잘리는 경우, 너무 짧아서 기회를 낭비하는 경우, 키워드 남발(keyword stuffing), 아예 누락된 경우다.

메타 설명(Meta Description)

메타 설명은 페이지마다 고유하게 작성해야 하며, 150~160자가 적정 길이다. 주요 키워드를 포함하고, 명확한 가치 제안과 행동 유도(call to action)를 담아야 한다.

흔한 문제로는 중복된 설명, 자동 생성된 의미 없는 텍스트, 길이가 부적절한 경우, 클릭할 이유가 없는 설명이 있다.

헤딩 구조

각 페이지에는 H1이 하나만 있어야 하며, H1에 주요 키워드를 포함해야 한다. H1에서 H2, H3로 이어지는 논리적 계층 구조를 갖추어야 하고, 헤딩이 실제 콘텐츠를 설명해야 한다. 단순히 스타일링 목적으로 헤딩 태그를 사용해서는 안 된다.

자주 발견되는 문제로는 H1이 여러 개인 경우, 단계를 건너뛰는 경우(H1에서 바로 H3으로), 스타일링 용도로만 헤딩을 사용하는 경우, 페이지에 H1이 없는 경우가 있다.

콘텐츠 최적화

본문 콘텐츠에서는 첫 100단어 이내에 키워드가 등장해야 하며, 관련 키워드가 자연스럽게 사용되어야 한다. 주제에 맞는 충분한 깊이와 분량을 확보하고, 검색 의도(search intent)에 부합해야 하며, 경쟁 사이트보다 더 나은 콘텐츠여야 한다.

얇은 콘텐츠(thin content) 문제도 점검 대상이다. 고유한 내용이 거의 없는 페이지, 가치를 제공하지 않는 태그/카테고리 페이지, 도어웨이 페이지(doorway page), 중복 또는 거의 중복인 콘텐츠가 해당된다.

이미지 최적화

이미지에는 설명적인 파일명을 사용하고, 모든 이미지에 alt 텍스트를 적용해야 한다. alt 텍스트는 이미지의 내용을 실제로 설명해야 하며, 파일 크기를 압축하고 WebP 같은 최신 형식을 사용하는 것이 좋다. 지연 로딩(lazy loading)과 반응형 이미지(responsive images)도 구현해야 한다.

내부 링크

중요한 페이지가 충분히 내부 링크를 받고 있는지, 설명적인 앵커 텍스트를 사용하는지, 링크 관계가 논리적인지, 깨진 내부 링크가 없는지, 페이지당 링크 수가 적절한지를 점검한다.

내부 링크에서 흔한 문제는 고아 페이지(어디에서도 링크되지 않는 페이지), 과도하게 최적화된 앵커 텍스트, 중요한 페이지가 깊이 묻혀 있는 경우, 푸터나 사이드바에 지나치게 많은 링크를 넣는 경우다.

키워드 타겟팅

페이지 단위로 보면 각 페이지에 명확한 주요 키워드 목표가 있어야 하며, 타이틀, H1, URL이 일관되게 정렬되어야 한다. 콘텐츠가 검색 의도를 충족해야 하고, 같은 사이트의 다른 페이지와 키워드가 겹치는 카니발리제이션(cannibalization)이 없어야 한다.

사이트 전체 차원에서는 키워드 매핑 문서가 있어야 하고, 주요 주제에서 커버리지 공백이 없어야 하며, 키워드 카니발리제이션이 발생하지 않아야 한다. 논리적인 주제 클러스터(topical cluster)를 구성하는 것이 효과적이다.

콘텐츠 품질 평가

E-E-A-T 신호

구글의 콘텐츠 품질 평가 기준인 E-E-A-T(Experience, Expertise, Authoritativeness, Trustworthiness)는 네 가지 축으로 구성된다.

경험(Experience)은 직접적인 체험이 드러나는지, 독자적인 인사이트나 데이터가 있는지, 실제 사례와 케이스 스터디가 포함되어 있는지를 본다. 전문성(Expertise)은 저자의 자격이 표시되어 있는지, 정확하고 상세한 정보인지, 주장에 적절한 출처가 있는지를 평가한다.

권위성(Authoritativeness)은 해당 분야에서 인정받는 존재인지, 다른 곳에서 인용되는지, 업계 자격을 갖추고 있는지를 확인한다. 신뢰성(Trustworthiness)은 정보가 정확한지, 사업에 대해 투명한지, 연락처 정보가 제공되는지, 개인정보 처리방침과 이용약관이 있는지, 사이트가 안전한지(HTTPS)를 점검한다.

구글의 검색 품질 평가 가이드라인에 따르면, 신뢰성(Trust)이 가장 핵심적인 요소다. "아무리 경험이 풍부하고, 전문적이고, 권위 있어 보이더라도 신뢰할 수 없는 페이지는 E-E-A-T가 낮다"고 명시하고 있다.

콘텐츠 깊이와 사용자 참여

콘텐츠는 주제를 포괄적으로 다루어야 하고, 후속 질문에도 답할 수 있어야 하며, 상위 노출 경쟁자보다 더 나아야 하고, 최신 상태로 유지되어야 한다. 사용자 참여 지표로는 페이지 체류 시간, 맥락에 맞는 이탈률(bounce rate), 세션당 페이지 수, 재방문 여부를 함께 살핀다.

사이트 유형별 주요 이슈

SaaS/제품 사이트

SaaS 사이트에서 흔히 발견되는 문제는 제품 페이지의 콘텐츠 깊이 부족이다. 블로그가 제품 페이지와 유기적으로 연결되지 않는 경우도 많고, 경쟁 제품 비교나 대안 페이지가 빠져 있는 경우가 많다. 기능 소개 페이지의 콘텐츠가 빈약하거나, 용어집이나 교육 콘텐츠가 아예 없는 경우도 흔하다.

이커머스

이커머스에서는 카테고리 페이지의 콘텐츠가 얇은 것이 가장 흔한 문제다. 제품 설명이 중복되거나, 제품 스키마(schema)가 누락되어 있거나, 패싯 내비게이션이 중복 페이지를 생성하거나, 품절 페이지가 제대로 처리되지 않는 경우가 있다.

콘텐츠/블로그 사이트

오래된 콘텐츠가 갱신되지 않는 것이 가장 큰 문제다. 키워드 카니발리제이션, 주제 클러스터링 부재, 부실한 내부 링크, 저자 페이지 미비 등이 주요 점검 포인트다.

로컬 비즈니스

NAP(이름, 주소, 전화번호) 정보의 일관성이 매우 중요하다. 로컬 스키마 누락, Google Business Profile 미최적화, 지역 페이지 부재, 지역 관련 콘텐츠 부재가 자주 발견되는 문제다.

감사 보고서 구성

SEO 감사 결과를 보고할 때는 다음과 같은 구조를 따르는 것이 효과적이다.

먼저 경영진 요약(Executive Summary)으로 전체 건강 상태를 평가하고, 상위 3~5개 우선순위 이슈와 빠른 성과(quick win)를 식별한다.

기술 SEO 발견 사항과 온페이지 SEO 발견 사항, 콘텐츠 발견 사항은 각각 동일한 형식으로 정리한다. 각 이슈에 대해 무엇이 문제인지, SEO에 미치는 영향(높음/중간/낮음), 어떻게 발견했는지, 구체적인 해결 방안, 우선순위를 명시한다.

마지막으로 우선순위 행동 계획을 네 단계로 구분한다. 첫째, 색인이나 순위를 차단하는 치명적 수정. 둘째, 영향력이 높은 개선 사항. 셋째, 쉽고 즉각적인 효과를 내는 빠른 성과. 넷째, 장기적 권고 사항이다.

AI 글쓰기 패턴 회피

SEO 콘텐츠를 작성할 때 AI가 생성한 것처럼 보이는 패턴을 피하는 것이 점점 더 중요해지고 있다. AI 탐지 도구와 독자 모두 특정 패턴을 인식하게 되었기 때문이다.

엠 대시(em dash) 남용

엠 대시(—)는 AI 생성 콘텐츠의 가장 신뢰할 수 있는 표식 중 하나가 되었다. AI 모델은 편집된 도서, 학술 논문, 스타일 가이드로 학습되어 엠 대시를 빈번하게 사용하지만, 실제 사람은 키보드에 해당 키가 없어 거의 사용하지 않는다. 엠 대시 대신 쉼표, 콜론, 괄호를 사용해야 한다. 예를 들어, "The results—which were surprising—showed..."보다는 "The results, which were surprising, showed..."가 자연스럽다. 페이지당 엠 대시가 하나 이상이면 수정을 고려해야 한다.

과다 사용 단어와 구문

AI가 즐겨 쓰는 동사와 형용사를 피해야 한다. "delve into" 대신 "explore"나 "examine"을, "leverage" 대신 "use"나 "apply"를, "robust" 대신 "strong"이나 "reliable"을, "comprehensive" 대신 "complete"나 "thorough"를 사용하는 것이 자연스럽다.

형용사에서도 "transformative", "cutting-edge", "groundbreaking", "seamless", "holistic" 같은 표현은 AI의 전형적 표식이다. 각각 "significant", "new", "original", "smooth", "complete"로 바꾸는 것이 낫다.

피해야 할 전형적 문구

도입부에서 "In today's fast-paced world...", "In the ever-evolving landscape of...", "Let's delve into..."와 같은 표현은 AI 글쓰기의 대표적 신호다. 전환 구문에서는 "That being said...", "It's worth mentioning that...", "At its core..."를 피한다. 마무리에서 "In conclusion...", "All things considered...", "At the end of the day..."도 마찬가지다.

구조적 패턴으로는 "Whether you're a X, Y, or Z..."처럼 세 가지를 나열하는 형태, "It's not just X, it's also Y..." 형태, "By understanding X, you can Y..."처럼 By로 시작하는 동명사 구문이 AI의 전형적 패턴이다.

자기 점검 방법

작성한 텍스트를 소리 내어 읽어본다. 대화에서 쓰지 않을 표현이면 수정한다. 반복적인 문장 구조가 없는지 확인하고, 위에 언급된 단어들이 모여 있는지 살핀다. 문장 길이가 다양한지, 각 강조어가 실제로 의미를 더하는지 검증한다.

답변 엔진 최적화(AEO)와 생성형 엔진 최적화(GEO)

검색 환경이 변화하면서 기존 SEO 외에 두 가지 새로운 최적화 영역이 중요해지고 있다.

답변 엔진 최적화(Answer Engine Optimization)

AEO는 AI 기반 시스템이 콘텐츠를 추출하여 사용자 질의에 대한 직접 답변으로 제시할 수 있도록 콘텐츠를 구조화하는 것이다. 추천 스니펫(featured snippet), AI 오버뷰, 음성 비서 응답 등이 대상이다. 구글 검색의 60% 이상이 클릭 없이 종료되는 시대에 이 접근은 필수적이다.

효과적인 AEO 콘텐츠 블록 패턴은 다음과 같다.

정의 블록은 "X란 무엇인가?" 유형의 질의에 대응한다. 간결한 1문장 정의로 시작하고, 핵심 특성을 포함한 1~2문장의 확장 설명을 덧붙이며, 왜 중요한지 또는 어떻게 사용되는지 간략한 맥락을 제공한다.

단계별 블록은 "X하는 방법" 질의에 적합하며, 리스트 스니펫에 최적화되어 있다. 프로세스에 대한 1문장 개요 후, 각 단계를 명확한 1~2문장의 실행 설명으로 나열한다. 비교 테이블은 "X vs Y" 질의에 대응하고, 장단점 블록은 "X가 가치가 있는가?"와 같은 평가 질의에 적합하다.

FAQ 블록은 여러 일반적 질문이 있는 주제 페이지에 필수적이다. FAQ 스키마와도 연결된다. 질문은 사용자가 실제로 검색하는 그대로의 자연스러운 문구를 사용하고, "People Also Ask"의 질의를 참고하며, 답변은 50~100단어로 유지한다.

생성형 엔진 최적화(Generative Engine Optimization)

GEO는 ChatGPT, Claude, Perplexity, Gemini 같은 AI 어시스턴트가 콘텐츠를 인용할 수 있도록 최적화하는 것이다.

통계 인용 블록은 특히 효과적이다. 통계를 포함하면 AI 인용률이 15~30% 증가한다는 연구 결과가 있다. 주장 문장, 출처와 함께 구체적인 수치와 기간을 포함한 통계, 왜 중요한지에 대한 맥락을 순서대로 배치한다.

전문가 인용 블록은 실명 전문가의 직접 인용으로 신뢰도를 높이고 인용 가능성을 높인다. 권위 있는 주장 블록은 명확한 출처 귀속과 함께 주장을 구조화하여 AI가 쉽게 추출할 수 있게 한다.

핵심 원칙: AI 인용에 최적화하려면 통계에는 반드시 출처를 명시하고, 전문가 이름과 소속을 포함하며, 추가 맥락 없이도 의미가 통하는 독립적 문장(self-contained answer)을 구성해야 한다.

도메인별 GEO 전략

기술 콘텐츠에서는 기술적 정확성과 올바른 용어를 강조하고, 소프트웨어나 도구의 버전 번호와 날짜를 포함하며, 공식 문서를 참조한다. 건강/의료 콘텐츠에서는 동료 심사(peer-reviewed) 논문을 인용하고, 전문가 자격(MD, RN 등)을 포함하며, 연구 한계를 명시하고, "마지막 검토일"을 추가한다.

금융 콘텐츠에서는 규제 기관(SEC, FTC 등)을 참조하고, 기간이 포함된 구체적 수치를 제시하며, 교육 목적이지 투자 조언이 아님을 명시한다. 법률 콘텐츠에서는 구체적인 법률과 조항을 인용하고, 관할권을 명확히 하며, 전문가 상담 권고를 포함한다. 비즈니스/마케팅 콘텐츠에서는 측정 가능한 결과가 포함된 케이스 스터디, 업계 리서치 인용, 변화율과 기간, 인정받는 사상 리더의 인용을 활용한다.

음성 검색 최적화

음성 질의는 대화체이며 질문 기반이다. "What is...", "How do I...", "Where can I find...", "Why does...", "When should I...", "Who is..."와 같은 질문 형식에 최적화해야 한다. 직접적인 답변을 30단어 이내로 앞에 배치하고, 자연스러운 대화체를 사용하며, 전문가 대상이 아닌 한 전문 용어를 피하고, 관련이 있다면 지역 맥락을 포함한다.

주요 도구

SEO 감사에 활용할 수 있는 도구는 무료와 유료로 나뉜다.

무료 도구로는 Google Search Console이 가장 필수적이며, Google PageSpeed Insights, Bing Webmaster Tools, Rich Results Test, Mobile-Friendly Test, Schema Validator가 있다. 유료 도구로는 Screaming Frog, Ahrefs, Semrush, Sitebulb, ContentKing이 대표적이다.