博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
用JAVA编写浏览器内核之实现javascript的document对象与内置方法
阅读量:4965 次
发布时间:2019-06-12

本文共 2174 字,大约阅读时间需要 7 分钟。

原创文章。转载请注明。

阅读本文之前,您须要对浏览器怎样载入javascript有一定了解。

当然,对java与javascript本身也须要了解。

本文首先介绍浏览器载入并执行javascript的原理。

其次将介绍怎样用java与javascript互调用对象。

最后介绍怎样用java实现javascript的document对象与其他内置方法。

浏览器从server得到含有javascript代码的html文本后,将顺序运行javascript代码块。

看代码是最简单的方式:

package org.taoningyu.js;import java.io.IOException;import java.net.MalformedURLException;import java.net.URL;import javax.script.Invocable;import javax.script.ScriptEngine;import javax.script.ScriptEngineManager;import javax.script.ScriptException;import org.jsoup.Jsoup;import org.jsoup.nodes.Document;import org.jsoup.nodes.Element;public class TaoDocument {	 Document mydoc = null;	public TaoDocument(String url) throws MalformedURLException, IOException{		mydoc = Jsoup.parse(new URL(url),30000);//利用Jsoup实现document树	}	    public Element getElementById(String id){//实现document的getElementById方法    	System.out.println("Java println:\t"+mydoc.getElementById(id));    	return mydoc.getElementById(id);//返回的是Element对象    }	public static void main(String[] args) throws MalformedURLException, IOException {					    ScriptEngineManager sem = new ScriptEngineManager();	    ScriptEngine se = sem.getEngineByName("javascript"); //初始化Java内置的javascript引擎	    try {	    		    	 se.eval("function test() {"	    		    + "id='areaDefault'; print('js print:'+document.getElementById(id));return document.getElementById(id);}");                  //測试用javascript自己定义函数,功能为输出id为areaDefault的元素,并返回。	    	 Invocable invocableEngine = (Invocable) se;//转换引擎类型为Invocable 	    	 se.put("document", new TaoDocument("http://www.ifeng.com/")); //关联对象,这一步非常重要,关联javascript的document对象为TaoDocument。亦即我自己实现的document对象	    	 Element callbackvalue=(Element) invocableEngine.invokeFunction("test"); //直接执行函数。返回值为Element	    	 System.out.println("callback return :"+callbackvalue); //打印输出返回内容	    	 se.eval("test()");//第二种调用函数方式,我更偏爱此种方式		} catch (ScriptException e) {			// TODO Auto-generated catch block			e.printStackTrace();		} catch (NoSuchMethodException e) {			// TODO Auto-generated catch block			e.printStackTrace();		} 	}}
通过实现document对象,就能够动态解析html页面了。

在另外的文章。我将介绍怎样结合httpclient,使其成为headless浏览器的雏形。

转载于:https://www.cnblogs.com/jhcelue/p/7211830.html

你可能感兴趣的文章
matlab读取cvs文件的几种方法
查看>>
谈谈iOS Animation
查看>>
如何设置eclipse新建工程内文件的默认编码格式
查看>>
46. Permutations
查看>>
170. Two Sum III - Data structure design
查看>>
背包九讲之四(混合三种背包问题)
查看>>
hdu2544(自己实现优先队列)
查看>>
南阳242
查看>>
shell脚本去重的几种方法
查看>>
【完全开源】百度地图Web service API C#.NET版,带地图显示控件、导航控件、POI查找控件...
查看>>
Ubuntu 12.04 the system is running in low-graphics mode
查看>>
iOS开发编码建议与编程经验(书写规范)
查看>>
gerrit使用
查看>>
C博客作业01--分支、顺序结构
查看>>
递归求任意数字之间的和
查看>>
FCC 16个初级算法解
查看>>
盒子的水平垂直居中几种方法
查看>>
团队项目简易聊天室开发NABCD分析
查看>>
[USACO4.1]麦香牛块Beef McNuggets 题解报告
查看>>
frame.origin.x 的意思和作用?
查看>>