Cara Mengekstrak Teks Dari Halaman Web

Mengekstraksi teks dari halaman Web dapat dilakukan dengan beberapa cara. Metode yang Anda pilih harus bergantung pada tujuan yang Anda pikirkan untuk teks. Jika semua kebutuhan bisnis Anda adalah untuk mencetak teks untuk digunakan sebagai instruksi atau panduan, Anda dapat mengekstraksi teks sebagai HTML saja. Jika ada gambar dan teks pada halaman Web dan Anda ingin menyimpan halaman itu dalam bentuk aslinya, Anda harus mengekstrak halaman Web lengkap. Ada tiga cara untuk mengekstraksi teks, dan ada dua cara untuk mengekstraksi teks dan gambar secara bersamaan.

Ekstrak Hanya Teks

1.

Buka halaman Web dari mana Anda ingin mengekstrak teks. Klik menu "File" dan klik opsi "Save as" atau "Save Page As". Pilih "Halaman Web, hanya HTML" dari menu tarik-turun Simpan sebagai Jenis, ketikkan nama untuk file tersebut dan klik "Simpan." Teks akan diekstraksi dan disimpan sebagai file HTML dengan opsi format halaman asli. File dapat dilihat di browser Web dan dapat diedit di editor teks seperti Notepad.

2.

Klik opsi "Simpan sebagai" atau "Simpan Halaman Sebagai" dan pilih "File Teks" dari menu drop-down Simpan sebagai Jenis. Ketikkan nama untuk file teks dan klik "Simpan." Teks dari halaman Web akan diekstraksi dan disimpan sebagai file teks yang dapat dilihat dalam editor teks dan program dokumen seperti Microsoft Word.

3.

Klik dan seret untuk memilih teks pada halaman Web yang ingin Anda ekstrak dan tekan "Ctrl-C" untuk menyalin teks. Buka editor teks atau program dokumen dan tekan "Ctrl-V" untuk menempelkan teks dari halaman Web ke dalam file teks atau jendela dokumen. Simpan file teks atau dokumen ke komputer Anda.

Ekstrak Teks dan Gambar

1.

Klik menu "File" di browser Web Anda dan klik opsi "Save as" atau "Save Page As". Pilih "Halaman Web, Selesai" dari menu tarik-turun Simpan sebagai Jenis dan ketikkan nama untuk file tersebut. Klik "Simpan." Teks dan gambar dari halaman Web akan diekstraksi dan disimpan. Teks akan ditempatkan di file HTML dan gambar akan ditempatkan di folder di lokasi yang sama dengan file HTML.

2.

Klik dua kali pada file HTML untuk melihat teks dan gambar yang diekstraksi. Mereka akan terbuka di browser Web Anda. Metode lain untuk mengekstraksi teks dan gambar hanya tersedia di browser Internet Explorer. Buka halaman Web yang diinginkan di Internet Explorer sebelum melanjutkan ke langkah berikutnya.

3.

Klik opsi "Simpan sebagai" dari menu File dan pilih "Arsip Web, file tunggal (* .mht)" dari menu tarik-turun Simpan sebagai Jenis. Ketikkan nama untuk file tersebut dan klik tombol "Simpan". Teks dan gambar akan diekstraksi dari halaman Web ke file. Klik dua kali pada file untuk melihat teks dan gambar yang diekstraksi di browser Web Anda.

Pesan Populer