HTML
Web前端网页分成三个层次:结构层HTML(网页内容的载体,通过标签描述内容含义)、表示层CSS(层叠样式表,如何显示有关内容)、行为层JavaScript(用来实现网页上的特效效果)
HTML简介
HTML(HyperTextMarkup Language),超文本标记语言;一个HTML文档通常由四个部分组成:
- 文档说明<!DOCTYPE HTML>:最顶部一行,声明告诉浏览器, 页面使用何种标记语言编写, 这会影响到浏览器渲染内容的方式
- 根标签html:整个网页是从<html>这里开始的,然后到</html>结束
- head标签:文档的头部描述了文档的各种属性和信息,头部元素主要有<title>,<script>,<style>,<link>,<meta>
- body标签:页面主体
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN" "http://www.w3.org/TR/html4/loose.dtd">
<html>
<head>
<title> 网页标题 </title>
<meta http-equiv="Content-Type" content="text/html; charset=utf-8" >
<link rel="stylesheet" type="text/css" href="mycss.css" >
<script type="text/javascript" src="myjs.js"></script>
</head>
<body>
<p>这是一个段落</p>
</body>
</html>
<!--以上html文档告诉浏览器,遵循W3C标准XHTML4.0版本规范(文件类型声明),采用编码utf-8,
标题是“网页标题”,描述的样式表是同目录的mycss.css文件,有关的javascript代码在同级的
myks.js文件中,内容是有一个段落,段落的内容是“这是一个段落”。 -->
字体标签:标签总是成对出现
1
2
title:网页标题
meta:常用于定义页面的说明,关键字,最后修改日期,和其它的元数据。这些元数据将服务于浏览器(如何布局或重载页面),搜索引擎和其它网络服务;
style:为HTML文档定义样式信息;必须属性type,值text/css
- 表单元素
- HTML运行原理:
Core Java学习笔记(十四)--网络编程
网络基础概念
- IP地址:为了能够方便的识别网络上的每个设备,网络中的每个设备都会有一个唯一的数字标识,这个就是IP地址;根据现有IPv4协议(32位)规定每个IP地址由4个0-255之间的数字组成,例如10.0.120.34
域名:IP地址不方便记忆,一个IP地址可以对应多个域名,一个域名只能对应一个IP地址,在网络中传输的数据,全部是以IP地址作为地址标识,所以在实际传输数据以前需要将域名转换为IP地址,实现这种功能的服务器称之为DNS服务器,也就是通俗的说法叫做域名解析。例如当用户在浏览器输入域名时,浏览器首先请求DNS服务器,将域名转换为IP地址,然后将转换后的IP地址反馈给浏览器,然后再进行实际的数据传输
端口:一个计算机可以同时运行多个网络程序,给每个程序分配唯一的端口,通过IP地址+端口号传输数据,不会互相之间产生干扰;端口的号码必须位于0-65535之间(2个字节,16位),每个端口唯一的对应一个网络程序,一个网络程序可以使用多个端口;
统一资源定位符:URL URI URL 四部分组成 协议+域名+端口+资源 - TCP/UDP协议
TCP:打电话 三次握手 面向连接 安全可靠 效率相对地下
UDP:短信 四次握手 非面向连接 效率高 - 通信协议分层 OSI模型 TCP/IP模型
IP协议。。。
网络爬虫原理
数据封装–拆分
InetAddress & InetSocketAddress
封装IP地址与DNS
InetSocketAddress 封装IP地址+端口
1
2
URL
TCP Socket
ServerSOcket Socket
UDP Socket
DatagramSocket DaragramPacket 底层还是IO