read : 검색엔진 로봇의 크롤링 제어 - robots.txt : 기술 #robots #seo::공대여자홈

#robots #seo

robots.txt

User-agent: Googlebot // 구글봇에 대해서

Disallow: /nogooglebot/ // /nogooglebot/ 부터 크롤링 금지

User-agent: * // 모든 봇은

Allow: / // 모든 페이지 크롤링 가능

Sitemap: https://www.example.com/sitemap.xml

Allow: /$ // 루트만 허용한다.

Disallow: /aaa*/ // /aaab/, /aaa-b/, /aaabcde/ 등으로 aaa 로 직하는 경로를 거부한다

구글의 경우 robots.txt로 막혀서 URL은 수집될 수 있음!

경고: robots.txt 파일을 Google 검색결과에서 웹페이지를 숨기는 수단으로 사용하지 마세요.

다른 페이지 내의 설명 텍스트에서 내 페이지를 가리키는 경우 Google은 페이지를 방문하지 않고도 URL의 색인을 생성할 수 있습니다. 검색결과에 페이지가 표시되지 않도록 하려면 비밀번호 보호나 noindex 등 다른 방법을 사용하세요.

No	제목	작성자	등록	조회
공지	[기본형] HTML (with 부트스트랩5.3 , jquery 3.7, vue.js)	공대여자	02/06 13:44	55099
공지	유용한 리눅스(LINUX) 명령어	공대여자	03/03 14:47	61920
공지	[공지] 기술 게시판	mins01	06/24 15:10	63194

일	월	화	수	목	금	토
8.31	9.1	9.2	9.3	9.4	9.5	9.6
9.7	9.8	9.9 mecab 형태소 분석기 KoNLPy: 파이썬 한국어 NLP 1	9.10	9.11	9.12	9.13
9.14	9.15	9.16 electron-sample-app new 1	9.17	9.18	9.19	9.20
9.21	9.22	9.23	9.24	9.25	9.26	9.27
9.28	9.29	9.30	10.1	10.2	10.3	10.4