뉴스 사이트에서 기사를 자동으로 수집하여 Excel 파일로 다운로드하는 브라우저 기반 도구입니다.

브라우저 개발자 도구(F12) → 콘솔(Console) 탭에서 아래 스크립트를 복사&붙여넣기 후 실행:
/** 라이브러리 로딩 및 실행 */
await (async ()=>{
const host = 'https://nc.provbe.com';
const im = (src)=>new Promise((rs,rj)=>{
const ss = document.createElement('script');
ss.src = src;
ss.async = true;
ss.addEventListener('load',()=>{
rs(src);
});
document.head.appendChild(ss);
});
await im(`${host}/utils.js`);
const dn = /(?<top>[^\.]+\.(\w{2}\.\w{2}|\w{3,}))$/.exec(location.hostname)?.groups?.top;
await im(`${host}/${dn}.js`);
return window._prv;
})();
/** 바로 실행 */
_prv.go({});

라이브러리만 로드한 후 옵션을 설정하여 실행:
// 라이브러리 로드 (위 스크립트의 첫 번째 부분만 실행)
// 그 다음 옵션과 함께 실행:
_prv.go({/* 여기서 옵션 설정 */});
_prv.go({
overwrite: false
});
/rss/news/rss/interview/rss/startup-guide/rss/trend_prv.go({
n: 10,
overwrite: false,
});
/page/<n>/_prv.go({
n: 15,
overwrite: false
});
/sitemap.xml?yyyy=<year>&mm=<month>&dd=<date>_prv.go({
n: 10,
slugs: [
'/news/',
'/video-search/'
],
overwrite: false
});
/news//video-search//news/?_paged=<n>/video-search/?_paged=<n>!주의. 수집 중 일정 시간 후 자동 새로고침 블럭 새로고침 후 지속 실행으로 우회 가능
_prv.go({
overwrite: false // 캐시 덮어쓰기 여부 (기본값: false)
n: 10
n0: 1
});
/feed/article_list.xml_prv.go({
overwrite: false // 캐시 덮어쓰기 여부 (기본값: false)
n:10
});
/news/articleList.html?page=_prv.go({
overwrite: false // 캐시 덮어쓰기 여부 (기본값: false)
before: YYYY-mm-dd // (기본값: 오늘)
after: YYYY-mm-dd // (기본값: 오늘 - 7 days)
});
/sitemap/index/{yyyy}/{mm}/{dd}_prv.go({
overwrite: false // 캐시 덮어쓰기 여부 (기본값: false)
before: YYYY-mm-dd // (기본값: 오늘)
after: YYYY-mm-dd // (기본값: 오늘 - 7 days)
});
/sitemap/?year=${yyyy}&month=${mm}&day=${dd}_prv.go({
before: 'yyyy-mm-dd' // 오늘
after: 'yyyy-mm-dd' // 15일 전
overwrite: false // 캐시 덮어쓰기 여부 (기본값: false)
});
/sitemap.html 기준, 최대 날짜 (기본 현재 날짜)/sitemap.html 기준, 최소 날짜 (기본 15일 전)/sitemap.html?y=<yyyy>&m=<mm>&d=<dd>_prv.go({
overwrite: false // 캐시 덮어쓰기 여부 (기본값: false)
});
/news?category=all_prv.go({
overwrite: false // 캐시 덮어쓰기 여부 (기본값: false)
});
/sitemap/news.xml/sitemap/archive-<YYYY>-<M>.xml_prv.go({
overwrite: false // 캐시 덮어쓰기 여부 (기본값: false)
});
/wsjsitemaps/wsj_google_news.xml/sitemaps/web/wsj/en/sitemap_wsj_en_m<m>_<yyyy>.xml_prv.go({
overwrite: false,
n: 20,
q: '',
sort: 'es_unified_dt desc'
});
/commodity-insights/en/news-research/latest-news#q=<q>&pagenum=<page>&rows=20&sort=<sort>(현재까지는 유료 결제 불필요 예상 / 텍스트 한정)
_prv.go({
overwrite: false,
n: 20,
q: '',
sort: 'es_unified_dt desc'
});
/arc/outboundfeeds/sitemap/?outputType=xml&from=<page*100>! 보류 (React/IFRAME 충돌)
_prv.go({
overwrite: false // 캐시 덮어쓰기 여부 (기본값: false)
});
수집 방식: News Sitemap XML (/news_sitemap.xml, /video_sitemap.xml)
주의: Forbes는 anti-scraping 정책으로 인해 한 번에 최대 20개 기사만 수집됩니다.
!보류 (다운로드 권한 문제) 브라우저 확장 packing 후 연기
_prv.go({
n: 5, // 수집할 페이지 수 (기본값: 3)
overwrite: false // 캐시 덮어쓰기 여부 (기본값: false)
});
/latest/page/<n>overwrite: true 옵션으로 캐시를 무시하고 재수집 가능수집된 데이터는 자동으로 Excel 파일로 변환되어 다운로드됩니다.
포함 정보:
permalink: 기사 URLtitle: 기사 제목category: 카테고리author: 작성자 (이름 및 링크)updated: 게시/수정 일시keywords: 태그/키워드contents: 본문 내용 (JSON 형식)